高效量化部署

# 高效量化部署

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

這是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多種量化類型以滿足不同硬件需求。

大型語言模型支持多種語言

Mistralai Devstral Small 2505 GGUF

Devstral-Small-2505的量化版本，支持多語言文本生成任務，適用於本地部署和推理。

大型語言模型支持多種語言

Seed Coder 8B Reasoning Bf16 Q6 K GGUF

這是一個基於ByteDance-Seed/Seed-Coder-8B-Reasoning-bf16轉換的GGUF格式模型，適用於代碼生成和推理任務。

大型語言模型

Nvidia OpenMath Nemotron 14B Kaggle GGUF

這是NVIDIA開源的14B參數數學大語言模型，經過llama.cpp量化處理，可在不同硬件條件下高效運行。

大型語言模型英語

Meta Llama 3.1 8B GGUF

Meta-Llama-3.1-8B的GGUF量化版本，基於llama.cpp工具生成，支持多語言文本生成任務。

大型語言模型支持多種語言

Llama 4 Scout 17B 16E Instruct GGUF

Llama-4-Scout-17B-16E-Instruct-GGUF是一款基於Llama-4-Scout-17B-16E-Instruct模型的量化版本，支持多語言處理，適用於聊天和指令任務。

大型語言模型

Transformers 支持多種語言

Meta Llama Llama 4 Scout 17B 16E Instruct Old GGUF

Llama-4-Scout-17B-16E-Instruct是Meta發佈的17B參數指令微調大語言模型，經過量化處理以提高運行效率

大型語言模型支持多種語言

Minicpm O 2 6 Gguf

MiniCPM-o 2.6是一個多模態模型，支持視覺和語言任務，專為llama.cpp設計。

圖像生成文本

Dolphin3.0 Llama3.2 1B GGUF

基於Llama3.2架構的1B參數量化模型，支持文本生成任務，適用於多種量化版本選擇

大型語言模型英語

Qwen2 VL 7B GGUF

Qwen2-VL-7B 是一個視覺語言模型，提供多種量化版本的 GGUF 格式模型文件，適用於 llama.cpp 使用。

文本生成圖像

Transformers 英語

Mixtral 8x22B Instruct V0.1 GGUF

基於mistralai/Mixtral-8x22B-Instruct-v0.1模型的GGUF量化版本，支持多語言文本生成任務

大型語言模型支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase