量化高效推理

# 量化高效推理

Microsoft.naturelm 8x7B Inst GGUF

NatureLM-8x7B-Inst的量化版本，旨在讓知識為每個人所用。

大型語言模型

Wan2.1 T2V 14B LightX2V StepCfgDistill VACE GGUF

萬2.1文本到視頻模型的GGUF格式轉換版本，支持文本到視頻、圖像到視頻和視頻到視頻的轉換，經過量化處理以提高運行效率。

文本生成視頻英語

Medra4b I1 GGUF

Medra4b是基於醫療數據集微調的多語言（英語和羅馬尼亞語）文本生成模型，專注於醫療領域應用。

大型語言模型

Transformers 支持多種語言

Medra4b是一個基於醫療領域的量化語言模型，支持英文和羅馬尼亞文，專注於文本生成和摘要任務。

大型語言模型

Transformers 支持多種語言

Medgemma 4b It Q8 0 GGUF

MedGemma-4B-it-Q8_0-GGUF 是基於 google/medgemma-4b-it 轉換而來的 GGUF 格式模型，專為醫療領域的圖像文本到文本任務設計。

圖像生成文本

Latitudegames.muse 12B GGUF

Muse-12B是一個12B參數的文本生成模型，由LatitudeGames開發，旨在提供高質量的文本生成能力。

大型語言模型

Arxiver Insightsumm T5 Finetuned Model GGUF

基於T5架構的靜態量化模型，專注於學術論文摘要生成任務

文本生成英語

Clinician Note 2.0a GGUF

Clinician-Note-2.0a是一個專注於醫學領域的文本生成模型，特別適用於AI輔助臨床記錄和摘要生成。

大型語言模型英語

Medra是基於醫療領域數據集微調的量化語言模型，專注於醫療問答和摘要生成任務。

大型語言模型支持多種語言

Granite 3.3 8b Instruct Q8 0 GGUF

該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型，適用於文本生成任務。

大型語言模型

Deepseek Qwen2.5 14B DeepThinker V2

DeepThinkerv2是一個具備深度數學推理能力的大語言模型，通過遞歸思考模式和多重驗證機制提升解題準確性。

大型語言模型英語

3b Fr Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-fr-ft-research_release模型轉換的GGUF格式法語語言模型，適用於文本生成任務。

大型語言模型法語

Gemma 3 27b It Qat Autoawq

Gemma 3是Google推出的輕量級前沿開放模型系列，基於與Gemini相同技術構建，支持多模態輸入（文本/圖像）和文本輸出。27B版本通過量化感知訓練顯著降低內存需求。

圖像生成文本

Gemma 3 12b It Qat Autoawq

Gemma 3是Google基於Gemini技術構建的輕量級開放模型系列，支持多模態輸入和文本輸出。

圖像生成文本

Gemma 3 12b It Q5 K M GGUF

這是由google/gemma-3-12b-it轉換而來的GGUF格式模型，適用於llama.cpp框架。

大型語言模型

Qwen2.5 14B CIC ACLARC GGUF

這是一個基於Qwen2.5-14B-Instruct模型進行量化處理的版本，專門用於引文意圖分類任務。

大型語言模型英語

Opencerebrum 1.0 7b SFT GGUF

OpenCerebrum-1.0-7b-SFT是一個基於Locutusque/OpenCerebrum-1.0-7b-SFT的靜態量化模型，支持多種量化版本，適用於代碼生成、數學、化學、生物學等領域的文本生成和問答任務。

大型語言模型支持多種語言

Dermatech Qwen2 VL 2B GGUF

這是一個基於Qwen2架構的多模態模型，支持文本生成、圖像轉文本和視覺問答任務，提供多種量化版本以適應不同需求。

圖像生成文本英語

Qwen2 VL 72B Instruct GGUF

Qwen2-VL-72B-Instruct-GGUF 是原模型經過量化處理後的版本，支持多模態任務，可通過 GaiaNet 運行。

圖像生成文本

Transformers 英語

Qwen2 VL 7B Instruct GGUF

Qwen2-VL-7B-Instruct 是一個7B參數規模的多模態模型，支持圖像與文本的交互任務。

圖像生成文本英語

Qwen2 VL 7B Instruct GGUF

Qwen2-VL-7B-Instruct 是一個多模態視覺語言模型，支持圖像和文本的聯合理解與生成任務。

圖像生成文本英語

Meta Llama 3 8B Instruct Q4 K M GGUF

Llama 3 8B 指令模型的 GGUF 量化版本，適用於本地推理，支持高效部署

大型語言模型英語

Mistral 7B OpenOrca Q4 K M GGUF

該模型是基於Open-Orca/Mistral-7B-OpenOrca轉換而來的GGUF格式模型，適用於文本生成任務。

大型語言模型英語

Finance LLM GGUF

Finance LLM 是一個專注於金融領域的語言模型，基於 Llama 架構，經過 OpenOrca、Lima 和 WizardLM 等數據集的微調。

大型語言模型英語

Tinyllama 1.1B Chat V0.6 GGUF

TinyLlama-1.1B-Chat-v0.6 是一個輕量級的聊天模型，基於1.1B參數的Llama架構，專為對話任務優化。

大型語言模型英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase