低資源推理

# 低資源推理

Diffucoder 7B Cpgrpo 4bit

DiffuCoder-7B-cpGRPO-4bit 是一個基於蘋果 DiffuCoder-7B-cpGRPO 模型轉換而來的 4 位量化版本，專為 MLX 框架優化。

大型語言模型其他

Kimi Dev 72B GGUF

Kimi-Dev-72B的量化版本，採用先進的非線性最優量化和多頭潛在注意力機制，減少存儲和計算需求。

大型語言模型其他

Delta Vector Austral 24B Winton GGUF

Delta-Vector的Austral-24B-Winton模型的量化版本，使用llama.cpp工具進行量化處理，適用於不同硬件配置的高效運行。

大型語言模型英語

Acereason Nemotron 14B GGUF

AceReason-Nemotron-14B是一個通過強化學習訓練的數學和代碼推理模型，在多個數學和代碼推理基準測試中表現出色。

大型語言模型

Qwen3是通義千問系列大語言模型的最新迭代，提供稠密模型與混合專家（MoE）模型的完整套件。基於大規模訓練，Qwen3在推理能力、指令遵循、智能體功能及多語言支持方面實現突破性進展。

大型語言模型

Motif 2.6B是一個擁有26億參數的語言模型，在AMD Instinct™ MI250 GPU上從頭開始訓練，旨在構建符合人類價值觀、有用且可靠的AI。

大型語言模型

Safetensors 支持多種語言

Motif-Technologies

Qwen3 235B A22B 4bit DWQ 053125

這是一個基於Qwen3-235B-A22B-8bit模型轉換而來的4位量化版本，專為MLX框架優化，適用於文本生成任務。

大型語言模型

Phantom Wan 1.3B GGUF

這是bytedance-research/Phantom模型的GGUF直接轉換版本，可在ComfyUI中結合ComfyUI-GGUF自定義節點使用。

文本生成視頻英語

Phantom Wan 1.3B GGUF

這是一個將 bytedance-research/Phantom 直接轉換為 GGUF 格式的項目，用於圖像到視頻的轉換任務。

文本生成視頻英語

Deepseek R1 0528 Qwen3 8B MLX 8bit

基於DeepSeek-R1-0528-Qwen3-8B模型的8位量化版本，專為蘋果Silicon芯片優化，適用於文本生成任務。

大型語言模型

lmstudio-community

Llama 3.3 70b Instruct Deepseek Distilled GGUF

基於unsloth/Llama-3.3-70B-Instruct-bnb-4bit微調的多語言文本生成模型，支持英語、西班牙語、拉丁語、阿拉伯語和法語。

大型語言模型

Transformers 支持多種語言

Dans PersonalityEngine V1.3.0 24b Q4 K M GGUF

基於Mistral-Small-3.1-24B-Base-2503的多語言文本生成模型，支持10種語言，適用於角色扮演和對話場景

大型語言模型

Gemma 3 1b It Fast GUFF

針對低端硬件和純CPU環境優化的量化版本，在資源限制下實現生產可用的推理就緒配置

大型語言模型

Llava 1.5 7b Hf Q4 K M GGUF

該模型是基於llava-hf/llava-1.5-7b-hf轉換的GGUF格式模型，支持圖像文本生成任務。

圖像生成文本英語

Seed Coder 8B Reasoning Bf16 Q6 K GGUF

這是一個基於ByteDance-Seed/Seed-Coder-8B-Reasoning-bf16轉換的GGUF格式模型，適用於代碼生成和推理任務。

大型語言模型

Magtie V1 12B GGUF

MagTie-v1-12B的GGUF量化版本集合，通過mergekit工具合併預訓練語言模型創建，適用於文本生成任務。

大型語言模型

Bielik 4.5B V3.0 Instruct GGUF

Bielik-4.5B-v3.0-Instruct-GGUF 是 SpeakLeash 發佈的波蘭語大語言模型，基於 Bielik-4.5B-v3.0-Instruct 轉換的 GGUF 量化格式，適用於本地推理。

大型語言模型其他

Qwen Qwen3 8B GGUF

Qwen3-8B的GGUF格式量化版本，由TensorBlock提供，兼容llama.cpp

大型語言模型

Nvidia OpenMath Nemotron 14B Kaggle GGUF

這是NVIDIA開源的14B參數數學大語言模型，經過llama.cpp量化處理，可在不同硬件條件下高效運行。

大型語言模型英語

Nousresearch DeepHermes 3 Llama 3 3B Preview GGUF

基於Llama-3-3B架構的指令微調模型，支持對話、推理和角色扮演等任務，適用於通用人工智能輔助場景。

大型語言模型英語

Llama 3 8B Instruct Abliterated TR

LLaMA-3-8B-Instruct的消融版本，通過特定技術手段強制模型用土耳其語響應

大型語言模型

Transformers 其他

Ring Lite Linear Preview

玲瓏線性預覽版是由InclusionAI開源發佈的混合線性稀疏大語言模型，總參數量17.1B，激活參數量3.0B。該模型基於混合線性注意力機制實現長文本推理，在推理過程中具備近線性計算複雜度與近恆定空間複雜度。

大型語言模型支持多種語言

Zero Mistral 24B Gguf

Zero-Mistral-24B 是一個基於 Mistral 架構的大型語言模型，支持俄語和英語，適用於對話和文本生成任務。

大型語言模型支持多種語言

Deepseek R1 GGUF UD

DeepSeek-R1 是一個高效的大語言模型，採用了 Unsloth Dynamic v2.0 量化技術，實現了卓越的準確性。

大型語言模型英語

Orpheus 3b Kaya Q2 K.gguf

基於Canopy Labs預訓練模型微調的文本轉語音模型，支持英語，採用GGUF Q2_K量化格式實現高效推理

語音合成支持多種語言

Orpheus 3b Kaya Q4 K M.gguf

基於Canopy Labs預訓練模型微調的文本轉語音模型，量化後支持高效推理

語音合成支持多種語言

Orpheus 3b Kaya FP16.gguf

基於Canopy Labs預訓練模型微調的文本轉語音(TTS)模型，量化為GGUF FP16格式以實現高效推理

語音合成支持多種語言

Orpheus 3b Kaya Q8 0.gguf

基於Canopy Labs預訓練模型微調的8位量化文本轉語音模型，支持英語24kHz音頻生成

語音合成支持多種語言

Google Gemma 3 27b It Qat GGUF

基於Google Gemma 3 270億參數指令調優模型的量化版本，採用量化感知訓練(QAT)權重生成，支持多種量化級別以適應不同硬件需求。

大型語言模型

Gemma 3 12b It GPTQ 4b 128g

該模型是對google/gemma-3-12b-it進行INT4量化的版本，通過GPTQ算法將參數從16比特降至4比特，顯著減少了磁盤空間和GPU內存需求。

圖像生成文本

3b Hi Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-hi-ft-research_release模型轉換的GGUF格式模型，支持印地語文本處理。

大型語言模型其他

Phi 4 Mini Instruct 8da4w

Phi-4-mini 是由 PyTorch 團隊開發的量化語言模型，採用8位嵌入和8位動態激活，以及4位權重線性層（8da4w）的量化方案，適合移動端部署。

大型語言模型

Transformers 其他

Meta Llama Llama 4 Scout 17B 16E Instruct Old GGUF

Llama-4-Scout-17B-16E-Instruct是Meta發佈的17B參數指令微調大語言模型，經過量化處理以提高運行效率

大型語言模型支持多種語言

Gemma 3 4b It Abliterated Q4 0 GGUF

該模型是mlabonne/gemma-3-4b-it-abliterated的GGUF格式轉換版本，結合了x-ray_alpha的視覺組件，提供更流暢的多模態體驗。

圖像生成文本

Gemma 3 4b It Q4 0

Gemma 3 4B Instruct 是 Google 開發的一個 40 億參數的大語言模型，專注於文本生成和理解任務。

大型語言模型

Doge 120M MoE Instruct

Doge模型採用動態掩碼注意力機制進行序列轉換，並可使用多層感知機或跨域專家混合進行狀態轉換。

大型語言模型

Transformers 英語

Bge Reranker Base Q4 K M GGUF

基於BAAI/bge-reranker-base模型轉換的GGUF格式重排序模型，支持中英文文本排序任務

文本嵌入支持多種語言

Turkish Llama 3 8B Function Calling GGUF

這是一個基於Turkish-Llama-8b-DPO-v0.1模型微調的土耳其語函數調用模型，專門用於執行土耳其語的函數調用任務。

大型語言模型

Transformers 支持多種語言

Qwen2.5 VL 7B Instruct Q8 0 GGUF

該模型是基於Qwen2.5-VL-7B-Instruct轉換的GGUF格式模型，支持多模態任務，適用於圖像和文本的交互處理。

文本生成圖像英語

Qwen2.5 VL 7B Instruct Q4 K M GGUF

這是Qwen2.5-VL-7B-Instruct模型的GGUF量化版本，適用於多模態任務，支持圖像和文本輸入。

圖像生成文本英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase