GGUF高效推理

# GGUF高效推理

Qwen2.5 VL 7B Meteorology I1 GGUF

Qwen2.5-VL-7B-Meteorology的量化版本，適用於氣象、氣候等領域的圖像文本處理任務，能在不同硬件條件下高效運行。

圖像生成文本

Transformers 英語

ERNIE 4.5 0.3B PT GGUF

該模型是百度ERNIE-4.5-0.3B-PT的GGUF格式轉換版本，支持中英文文本生成任務。

大型語言模型支持多種語言

Wan2.1 14B VACE GGUF

Wan2.1-VACE-14B模型的GGUF格式版本，主要用於文本到視頻的生成任務。

文本生成視頻

Gemma 2 9b It Russian Function Calling GGUF

該模型是基於google/gemma-2-9b-it針對函數調用任務進行微調的版本，訓練數據完全由人工標註，使用了俄語版本的DiTy/function-calling數據集。

大型語言模型其他

3b De Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-de-ft-research_release模型轉換而來的GGUF格式模型，專門優化用於德語文本處理。

大型語言模型德語

3b Zh Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-zh-ft-research_release轉換至GGUF格式的中文語言模型，適用於文本生成任務。

大型語言模型中文

3b De Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-de-ft-research_release模型轉換的GGUF格式德語語言模型，適用於文本生成任務。

大型語言模型德語

Slim Orpheus 3b JAPANESE Ft Q4 K M GGUF

這是一個基於slim-orpheus-3b-JAPANESE-ft模型轉換的GGUF格式模型，專門針對日語文本處理進行了優化。

大型語言模型日語

3b Es It Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-es_it-ft-research_release轉換的GGUF格式模型，支持西班牙語和意大利語。

大型語言模型支持多種語言

Llama 3 3 Nemotron Super 49B V1 Q6 K GGUF

該模型是基於NVIDIA的Llama-3_3-Nemotron-Super-49B-v1轉換而來的GGUF格式版本，適用於文本生成任務。

大型語言模型英語

Qwen2.5 VL 72B Instruct GGUF

Qwen2.5-VL-72B-Instruct是一個72B參數規模的多模態大模型，支持視覺-語言任務，能夠理解和生成與圖像相關的文本內容。

文本生成圖像英語

Qwen2.5 VL 32B Instruct GGUF

Qwen2.5-VL-32B-Instruct 是一個32B參數規模的多模態視覺語言模型，支持圖像和文本的聯合理解與生成任務。

圖像生成文本英語

Bge Reranker V2 M3 Q4 K M GGUF

本模型是基於BAAI/bge-reranker-v2-m3轉換的GGUF格式模型，用於文本排序任務，支持多語言。

文本嵌入其他

Llama 3.1 Nemotron Nano 8B V1 GGUF

NVIDIA發佈的8B參數規模的開源大語言模型，基於Llama-3架構，提供多種量化版本

大型語言模型英語

Gemma 3 12b It Q6 K GGUF

這是Google Gemma 3B模型的GGUF量化版本，適用於本地部署和推理。

大型語言模型

T5 Small Q4 K M GGUF

該模型是通過ggml.ai的GGUF-my-repo空間，使用llama.cpp從google-t5/t5-small轉換至GGUF格式的量化版本。

機器翻譯支持多種語言

Mistral 7B Business F16 GGUF

這是一個基於Mistral-7B的商業領域適配模型，轉換為GGUF格式以便在llama.cpp中使用。

大型語言模型英語

rafaelldietrich

Teuken 7B Instruct Research V0.4 Q6 K GGUF

該模型是基於openGPT-X/Teuken-7B-instruct-research-v0.4轉換的GGUF格式版本，支持多語言文本生成任務。

大型語言模型支持多種語言

Noticia 7B GGUF

NoticIA-7B是一個基於西班牙語的新聞摘要生成模型，專注於處理新聞內容並生成摘要。

大型語言模型西班牙語

Mental Health FineTuned Mistral 7B Instruct V0.2 I1 GGUF

這是一個基於Mistral-7B-Instruct-v0.2模型微調的心理健康諮詢對話模型，提供了多種量化版本以適應不同需求。

大型語言模型英語

Bge Reranker Large Q4 K M GGUF

該模型是基於BAAI/bge-reranker-large轉換而來的GGUF格式模型，用於重排序任務，支持中英文。

文本嵌入支持多種語言

T5 Small Q8 0 GGUF

該模型是通過ggml.ai的GGUF-my-repo空間，使用llama.cpp從google-t5/t5-small轉換為GGUF格式的量化版本。

機器翻譯支持多種語言

Summllama3 8B Q3 K M GGUF

該模型是基於DISLab/SummLlama3-8B轉換的GGUF格式模型，適用於文本摘要任務。

Bge Reranker V2 M3 Q4 K M GGUF

該模型是從BAAI/bge-reranker-v2-m3轉換而來的GGUF格式模型，用於文本重排序任務，支持多語言。

文本嵌入其他

C4ai Command R 08 2024

這是一個基於CoForAI/c4ai-command-r-08-2024模型轉換的GGUF格式文本生成模型，支持多種語言。

大型語言模型支持多種語言

Gguf Sharded LaMini Flan T5 248M

這是一個基於MBZUAI/LaMini-Flan-T5-248M模型轉換的GGUF格式模型，適用於文本生成任務。

大型語言模型英語

Llava Llama 3 8b V1 1 Q3 K S GGUF

該模型是基於xtuner/llava-llama-3-8b-v1_1轉換的GGUF格式模型，支持圖像和文本的多模態處理。

圖像生成文本

Meta Llama 3 8B Instruct GGUF

Meta-Llama-3-8B-Instruct的GGUF量化版本，適用於本地部署和推理

大型語言模型英語

Wizardlm 2 8x22B GGUF

WizardLM-2-8x22B-GGUF是微軟WizardLM-2-8x22B模型的GGUF格式量化版本，支持多種比特量化，適用於文本生成任務。

大型語言模型

Taiwan LLM 13B V2.0 Chat GGUF

基於LLaMa2-13b的臺灣大語言模型，支持繁體中文，採用GGUF格式

大型語言模型中文

Tinyllama V0 GGUF

TinyLLama-v0 是一個輕量級語言模型，基於 GGUF 格式提供，適用於文本生成任務。

大型語言模型英語

Pygmalion 2 13B SuperCOT Weighed GGUF

這是Pygmalion-2-13b與SuperCOT的加權融合實驗模型，支持指令格式交互，適用於文本生成任務。

大型語言模型英語

Codellama 7B Python GGUF

CodeLlama 7B Python是Meta開發的專注於Python代碼生成的7B參數大語言模型，提供GGUF格式量化版本

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase