輕量級部署

# 輕量級部署

Midm 2.0 Mini Instruct Gguf

Mi:dm 2.0 是一款以韓國為中心的 AI 模型，由 KT 運用其專有技術開發。該模型深入內化了韓國社會獨特的價值觀、認知框架和常識推理，不僅能處理和生成韓語內容，還能體現對韓國社會文化規範和價值觀的深刻理解。

大型語言模型

Transformers 支持多種語言

Bge Large Zh V1.5 Gguf

以GGUF格式提供的BAAI/bge-large-zh-v1.5量化與非量化嵌入模型，適用於llama.cpp，在CPU上能顯著提速且精度損失極小。

Qari OCR 0.3 SNAPSHOT VL 2B Instruct Merged GGUF

這是一個基於Qari-OCR-0.3-SNAPSHOT-VL-2B-Instruct-merged模型的靜態量化版本，主要用於圖像到文本的轉換任務。

圖像生成文本

Transformers 英語

Devstral Small 2505 GGUF

專為軟件工程項目打造的高效語言模型，輕量級設計，支持128k大上下文窗口，適用於複雜編碼任務。

大型語言模型支持多種語言

Kakaocorp.kanana Safeguard 8b GGUF

本項目是kakaocorp/kanana-safeguard-8b的量化版本，致力於讓知識為大眾所用。

大型語言模型

Devstral Small 2505 Unsloth Bnb 4bit

Devstral是由Mistral AI和All Hands AI合作開發的軟件工程任務代理型大語言模型，擅長使用工具探索代碼庫、編輯多個文件以及驅動軟件工程代理。

大型語言模型

Safetensors 支持多種語言

Devstral Small 2505 Fp8

Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能體大語言模型，擅長利用工具探索代碼庫、編輯多文件及驅動軟件工程智能體。

大型語言模型

Safetensors 支持多種語言

Devstral Small 2505 8bit

Devstral-Small-2505-8bit 是一個基於 mistralai/Devstral-Small-2505 轉換的 8 位量化模型，適用於 MLX 框架，支持多種語言的文本生成任務。

大型語言模型支持多種語言

Devstral Small 2505

Devstral是一款專為軟件工程任務設計的智能大語言模型，由Mistral AI和All Hands AI合作開發，擅長代碼探索、多文件編輯和驅動軟件工程智能體。

大型語言模型

Safetensors 支持多種語言

Devstral Small 2505 Gguf

Devstral是一款專為軟件工程任務設計的智能大型語言模型，由Mistral AI和All Hands AI合作開發，擅長代碼探索、編輯和驅動軟件工程代理。

大型語言模型支持多種語言

Devstral Small 2505 GGUF

Devstral是一款專為軟件工程任務設計的智能LLM，由Mistral AI和All Hands AI合作開發，擅長代碼探索、多文件編輯和驅動軟件工程代理。

大型語言模型支持多種語言

TEN VAD 是一個低延遲、輕量級、高性能的流式語音活動檢測系統，適用於即時語音處理場景。

語音識別其他

Devstral Small 2505

Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能大語言模型，擅長代碼庫探索、多文件編輯和驅動軟件工程代理。

大型語言模型

Safetensors 支持多種語言

Qwen2.5 7b SFT Three Subtasks 3epoch

這是一個基於🤗 transformers庫的模型，具體功能和用途尚未明確說明。

大型語言模型

Openvision Vit Huge Patch14 84

OpenVision 是一個全開放、高性價比的先進視覺編碼器家族，專為多模態學習設計。

Openvision Vit Large Patch14 84

OpenVision是一個全開放、高性價比的先進視覺編碼器家族，專注於多模態學習任務。

Openvision Vit Base Patch8 224

OpenVision 是一個全開放、高性價比的先進視覺編碼器家族，專注於多模態學習。

Parakeet Tdt 0.6b V2 Mlx

這是一個自動語音識別模型，已轉換為適用於MLX的版本，可快速進行推理。

Safetensors 英語

Allenai.olmo 2 0425 1B Instruct GGUF

OLMo-2-0425-1B-Instruct是由AllenAI開發的一個10億參數規模的指令微調語言模型，專注於文本生成任務。

大型語言模型

Phi 4 Mini Reasoning GGUF

Phi-4-mini-reasoning 是一個基於合成數據構建的輕量級開放模型，專注於高質量、富含推理的數據，並針對更高級的數學推理能力進行了進一步微調。

大型語言模型

Josiefied Qwen3 4B Abliterated V1 4bit

這是一個基於Qwen3-4B模型轉換到MLX格式的4位量化版本，適用於文本生成任務。

大型語言模型

Ast Finetuned Audioset 10 10 0.4593 ONNX

這是AST(Audio Spectrogram Transformer)模型的ONNX版本，專為音頻分類任務設計，在AudioSet數據集上進行了微調。

Microsoft Phi 4 Mini Reasoning GGUF

這是微軟Phi-4-mini-reasoning模型的量化版本，使用llamacpp工具進行量化處理，旨在提升模型在不同硬件環境下的運行效率和性能。

大型語言模型支持多種語言

Josiefied Qwen3 4B Abliterated V1 Gguf

這是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本，適用於本地部署和運行。

大型語言模型

Goekdeniz-Guelmez

Quantized Dia 1.6B Int8

Dia是一款16億參數的開源文本轉語音模型，支持生成高度逼真的對話和非語言表達

Safetensors 支持多種語言

Dia是一款開源權重的文本轉對話模型，支持對話文本生成和語音合成。

語音合成英語

Mistral Small 24B Instruct 2501 GGUF

Mistral-Small-24B-Instruct-2501 是一個24B參數規模的指令微調大語言模型，支持多語言文本生成任務。

大型語言模型支持多種語言

Gemma 3 27b It Qat Unsloth Bnb 4bit

Gemma 3是Google推出的輕量級、最先進的多模態開源模型，能夠處理文本和圖像輸入並生成文本輸出。

圖像生成文本

Gemma 3 1b It Qat

Gemma 3是谷歌推出的輕量級多模態模型，能夠處理文本和圖像輸入並生成文本輸出。該模型具有128K大上下文窗口和超140種語言的多語言支持。

圖像生成文本

Hyperclovax SEED Text Instruct 0.5B

一款具備指令跟隨能力的韓語優化文本生成模型，輕量級設計適合邊緣設備部署

大型語言模型

naver-hyperclovax

Gemma 3 4b It Qat GGUF

Gemma 3是谷歌推出的輕量級先進開放模型系列，基於創建Gemini模型的相同研究和技術構建。該模型是多模態的，能夠處理文本和圖像輸入並生成文本輸出。

文本生成圖像英語

GigaAM v2 是一個自動語音識別（ASR）模型，支持俄語語音轉文本任務，提供CTC和RNN-T兩種架構。

語音識別其他

Gemma 3 27b It Qat

Gemma是Google推出的輕量級開放模型系列，基於Gemini模型技術構建。Gemma 3是多模態模型，支持文本和圖像輸入，生成文本輸出，具有128K大上下文窗口和多語言能力。

圖像生成文本

Google Gemma 3 4b It Qat GGUF

基於Google QAT權重量化的Gemma 3B模型，支持多種量化級別，適用於資源受限環境下的高效推理。

大型語言模型

Granite 3.3 8b Instruct Q8 0 GGUF

該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型，適用於文本生成任務。

大型語言模型

Gemma 3 12b It Qat 3bit

這是一個基於 Google Gemma 3-12B 模型轉換而來的 MLX 格式模型，支持圖像文本到文本的任務。

圖像生成文本

Transformers 其他

3b Fr Ft Research Release Q4 K M GGUF

這是一個基於canopylabs/3b-fr-ft-research_release模型轉換的GGUF格式法語語言模型，適用於文本生成任務。

大型語言模型法語

Gemma 3 4b It Qat Int4 Unquantized

Gemma 3是Google推出的輕量級多模態開放模型，支持文本和圖像輸入，生成文本輸出。4B版本經過指令調優和量化感知訓練，適合資源有限環境部署。

圖像生成文本

Gemma 3 1b It Qat Int4 Unquantized

Gemma是Google推出的輕量級先進開放模型系列，基於與Gemini相同技術構建，支持多模態輸入和文本生成。

大型語言模型

Gemma 3 1b It Qat Q4 0 Unquantized

Gemma 3是Google推出的輕量級開源多模態模型系列，基於Gemini技術構建，支持文本和圖像輸入，生成文本輸出。1B版本經過指令調優和量化感知訓練(QAT)，適合資源有限環境部署。

圖像生成文本

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase