高效量化推理

# 高效量化推理

Gryphe Codex 24B Small 3.2 GGUF

這是Gryphe的Codex-24B-Small-3.2模型的量化版本，通過量化技術優化了在不同硬件條件下的運行效率。

大型語言模型英語

Blitzar Coder 4B F.1 GGUF

Blitzar-Coder-4B-F.1是一個高效的多語言編碼模型，基於Qwen3-4B微調，支持10多種編程語言，具備出色的代碼生成、調試和推理能力。

大型語言模型

Qwen3是通義千問系列最新一代大語言模型，提供完整的稠密模型與混合專家（MoE）模型組合。基於大規模訓練，Qwen3在推理能力、指令遵循、智能體功能及多語言支持方面實現突破性進展。

大型語言模型英語

Qwen3 8B NEO Imatrix Max GGUF

基於Qwen3-8B模型的NEO Imatrix量化版本，支持32K長上下文和增強推理能力

大型語言模型

Llava 1.5 13b Hf I1 GGUF

該項目提供了llava-1.5-13b-hf模型的加權/矩陣量化版本，包含多種量化類型選擇，適用於不同場景下的使用需求。

文本生成圖像

Transformers 英語

Mistral Small 3.1 24B Instruct 2503 Q4 K M GGUF

這是一個基於mistralai/Mistral-Small-3.1-24B-Instruct-2503轉換的GGUF格式模型，支持多語言文本生成任務。

大型語言模型支持多種語言

LGAI EXAONE EXAONE Deep 2.4B GGUF

這是LGAI-EXAONE發佈的EXAONE-Deep-2.4B模型的量化版本，使用llama.cpp進行量化，支持英語和韓語文本生成任務。

大型語言模型支持多種語言

Zed Industries Zeta GGUF

這是對zed-industries的zeta模型進行的Llamacpp imatrix量化版本，解決了在不同硬件條件下高效運行模型的問題，提供了多種量化類型供用戶選擇。

大型語言模型

Virtuoso Lite GGUF

Virtuoso-Lite的量化版本，使用llama.cpp進行量化處理，提升在不同硬件上的運行效率。

大型語言模型

Qwen2 VL 7B Instruct GGUF

基於Qwen2-VL-7B-Instruct的多模態模型量化版本，支持圖像文本到文本任務，適用於多種量化級別。

圖像生成文本英語

Eurollm 9B Instruct GGUF

EuroLLM-9B-Instruct是一個多語言指令跟隨大語言模型，支持40+種語言，特別優化了歐洲語言處理能力。

大型語言模型支持多種語言

T5 3b Q4 K M GGUF

該模型是通過ggml.ai的GGUF-my-repo空間，使用llama.cpp從google-t5/t5-3b轉換至GGUF格式的量化版本。

機器翻譯支持多種語言

Nxcode CQ 7B Orpo IMat GGUF

這是NTQAI/Nxcode-CQ-7B-orpo模型的Llama.cpp imatrix量化版本，提供了多種量化類型的文件，適用於不同場景的需求。

大型語言模型

Wizardlm 2 7B Abliterated GGUF

這是使用llama.cpp對WizardLM-2-7B進行量化後的版本，基於正交化bfloat16 safetensor權重處理，支持多輪對話。

大型語言模型

Deepseek V2 Lite Chat IMat GGUF

DeepSeek-V2-Lite-Chat 的 GGUF 量化版本，支持多種量化類型，適用於本地部署和推理。

大型語言模型

Mixtral 8x7B Instruct V0.1 Offloading Demo

Mixtral 是一個支持多語言的文本生成模型，採用混合專家（MoE）架構，支持英語、法語、意大利語、德語和西班牙語。

大型語言模型

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase