# 輕量級部署

Midm 2.0 Mini Instruct Gguf
MIT
Mi:dm 2.0 是一款以韓國為中心的 AI 模型,由 KT 運用其專有技術開發。該模型深入內化了韓國社會獨特的價值觀、認知框架和常識推理,不僅能處理和生成韓語內容,還能體現對韓國社會文化規範和價值觀的深刻理解。
大型語言模型 Transformers 支持多種語言
M
mykor
470
3
Bge Large Zh V1.5 Gguf
MIT
以GGUF格式提供的BAAI/bge-large-zh-v1.5量化與非量化嵌入模型,適用於llama.cpp,在CPU上能顯著提速且精度損失極小。
文本嵌入
B
CompendiumLabs
1,213
12
Qari OCR 0.3 SNAPSHOT VL 2B Instruct Merged GGUF
這是一個基於Qari-OCR-0.3-SNAPSHOT-VL-2B-Instruct-merged模型的靜態量化版本,主要用於圖像到文本的轉換任務。
圖像生成文本 Transformers 英語
Q
mradermacher
188
0
Devstral Small 2505 GGUF
Apache-2.0
專為軟件工程項目打造的高效語言模型,輕量級設計,支持128k大上下文窗口,適用於複雜編碼任務。
大型語言模型 支持多種語言
D
Mungert
1,409
1
Kakaocorp.kanana Safeguard 8b GGUF
本項目是kakaocorp/kanana-safeguard-8b的量化版本,致力於讓知識為大眾所用。
大型語言模型
K
DevQuasar
156
1
Devstral Small 2505 Unsloth Bnb 4bit
Apache-2.0
Devstral是由Mistral AI和All Hands AI合作開發的軟件工程任務代理型大語言模型,擅長使用工具探索代碼庫、編輯多個文件以及驅動軟件工程代理。
大型語言模型 Safetensors 支持多種語言
D
unsloth
873
3
Devstral Small 2505 Fp8
Apache-2.0
Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能體大語言模型,擅長利用工具探索代碼庫、編輯多文件及驅動軟件工程智能體。
大型語言模型 Safetensors 支持多種語言
D
bullerwins
243
1
Devstral Small 2505 8bit
Apache-2.0
Devstral-Small-2505-8bit 是一個基於 mistralai/Devstral-Small-2505 轉換的 8 位量化模型,適用於 MLX 框架,支持多種語言的文本生成任務。
大型語言模型 支持多種語言
D
mlx-community
789
1
Devstral Small 2505
Apache-2.0
Devstral是一款專為軟件工程任務設計的智能大語言模型,由Mistral AI和All Hands AI合作開發,擅長代碼探索、多文件編輯和驅動軟件工程智能體。
大型語言模型 Safetensors 支持多種語言
D
unsloth
317
11
Devstral Small 2505 Gguf
Apache-2.0
Devstral是一款專為軟件工程任務設計的智能大型語言模型,由Mistral AI和All Hands AI合作開發,擅長代碼探索、編輯和驅動軟件工程代理。
大型語言模型 支持多種語言
D
mistralai
8,964
44
Devstral Small 2505 GGUF
Apache-2.0
Devstral是一款專為軟件工程任務設計的智能LLM,由Mistral AI和All Hands AI合作開發,擅長代碼探索、多文件編輯和驅動軟件工程代理。
大型語言模型 支持多種語言
D
unsloth
72.26k
64
Ten Vad
Apache-2.0
TEN VAD 是一個低延遲、輕量級、高性能的流式語音活動檢測系統,適用於即時語音處理場景。
語音識別 其他
T
TEN-framework
16
29
Devstral Small 2505
Apache-2.0
Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能大語言模型,擅長代碼庫探索、多文件編輯和驅動軟件工程代理。
大型語言模型 Safetensors 支持多種語言
D
mistralai
102.17k
601
Qwen2.5 7b SFT Three Subtasks 3epoch
這是一個基於🤗 transformers庫的模型,具體功能和用途尚未明確說明。
大型語言模型 Transformers
Q
mjfmark
97
1
Openvision Vit Huge Patch14 84
Apache-2.0
OpenVision 是一個全開放、高性價比的先進視覺編碼器家族,專為多模態學習設計。
圖像分類 Transformers
O
UCSC-VLAA
19
0
Openvision Vit Large Patch14 84
Apache-2.0
OpenVision是一個全開放、高性價比的先進視覺編碼器家族,專注於多模態學習任務。
圖像分類 Transformers
O
UCSC-VLAA
21
0
Openvision Vit Base Patch8 224
Apache-2.0
OpenVision 是一個全開放、高性價比的先進視覺編碼器家族,專注於多模態學習。
圖像分類
O
UCSC-VLAA
43
0
Parakeet Tdt 0.6b V2 Mlx
這是一個自動語音識別模型,已轉換為適用於MLX的版本,可快速進行推理。
語音識別 Safetensors 英語
P
senstella
183
6
Allenai.olmo 2 0425 1B Instruct GGUF
OLMo-2-0425-1B-Instruct是由AllenAI開發的一個10億參數規模的指令微調語言模型,專注於文本生成任務。
大型語言模型
A
DevQuasar
220
1
Phi 4 Mini Reasoning GGUF
MIT
Phi-4-mini-reasoning 是一個基於合成數據構建的輕量級開放模型,專注於高質量、富含推理的數據,並針對更高級的數學推理能力進行了進一步微調。
大型語言模型 Transformers
P
Mungert
3,592
3
Josiefied Qwen3 4B Abliterated V1 4bit
這是一個基於Qwen3-4B模型轉換到MLX格式的4位量化版本,適用於文本生成任務。
大型語言模型
J
mlx-community
175
1
Ast Finetuned Audioset 10 10 0.4593 ONNX
這是AST(Audio Spectrogram Transformer)模型的ONNX版本,專為音頻分類任務設計,在AudioSet數據集上進行了微調。
音頻分類 Transformers
A
onnx-community
684
1
Microsoft Phi 4 Mini Reasoning GGUF
MIT
這是微軟Phi-4-mini-reasoning模型的量化版本,使用llamacpp工具進行量化處理,旨在提升模型在不同硬件環境下的運行效率和性能。
大型語言模型 支持多種語言
M
bartowski
1,667
7
Josiefied Qwen3 4B Abliterated V1 Gguf
Apache-2.0
這是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本,適用於本地部署和運行。
大型語言模型
J
Goekdeniz-Guelmez
4,518
7
Quantized Dia 1.6B Int8
Apache-2.0
Dia是一款16億參數的開源文本轉語音模型,支持生成高度逼真的對話和非語言表達
語音合成 Safetensors 支持多種語言
Q
RobAgrees
69
0
Dia 1.6B
Apache-2.0
Dia是一款開源權重的文本轉對話模型,支持對話文本生成和語音合成。
語音合成 英語
D
mlx-community
370
12
Mistral Small 24B Instruct 2501 GGUF
Apache-2.0
Mistral-Small-24B-Instruct-2501 是一個24B參數規模的指令微調大語言模型,支持多語言文本生成任務。
大型語言模型 支持多種語言
M
bartowski
48.61k
111
Gemma 3 27b It Qat Unsloth Bnb 4bit
Gemma 3是Google推出的輕量級、最先進的多模態開源模型,能夠處理文本和圖像輸入並生成文本輸出。
圖像生成文本 Transformers
G
unsloth
2,591
1
Gemma 3 1b It Qat
Gemma 3是谷歌推出的輕量級多模態模型,能夠處理文本和圖像輸入並生成文本輸出。該模型具有128K大上下文窗口和超140種語言的多語言支持。
圖像生成文本 Transformers
G
unsloth
2,558
1
Hyperclovax SEED Text Instruct 0.5B
其他
一款具備指令跟隨能力的韓語優化文本生成模型,輕量級設計適合邊緣設備部署
大型語言模型 Transformers
H
naver-hyperclovax
7,531
60
Gemma 3 4b It Qat GGUF
Gemma 3是谷歌推出的輕量級先進開放模型系列,基於創建Gemini模型的相同研究和技術構建。該模型是多模態的,能夠處理文本和圖像輸入並生成文本輸出。
文本生成圖像 英語
G
unsloth
2,629
2
Gigaam V2 Onnx
MIT
GigaAM v2 是一個自動語音識別(ASR)模型,支持俄語語音轉文本任務,提供CTC和RNN-T兩種架構。
語音識別 其他
G
istupakov
170
2
Gemma 3 27b It Qat
Gemma是Google推出的輕量級開放模型系列,基於Gemini模型技術構建。Gemma 3是多模態模型,支持文本和圖像輸入,生成文本輸出,具有128K大上下文窗口和多語言能力。
圖像生成文本 Transformers
G
unsloth
168
2
Google Gemma 3 4b It Qat GGUF
基於Google QAT權重量化的Gemma 3B模型,支持多種量化級別,適用於資源受限環境下的高效推理。
大型語言模型
G
bartowski
4,538
4
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型,適用於文本生成任務。
大型語言模型
G
NikolayKozloff
36
2
Gemma 3 12b It Qat 3bit
其他
這是一個基於 Google Gemma 3-12B 模型轉換而來的 MLX 格式模型,支持圖像文本到文本的任務。
圖像生成文本 Transformers 其他
G
mlx-community
65
1
3b Fr Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-fr-ft-research_release模型轉換的GGUF格式法語語言模型,適用於文本生成任務。
大型語言模型 法語
3
freddyaboulton
173
1
Gemma 3 4b It Qat Int4 Unquantized
Gemma 3是Google推出的輕量級多模態開放模型,支持文本和圖像輸入,生成文本輸出。4B版本經過指令調優和量化感知訓練,適合資源有限環境部署。
圖像生成文本 Transformers
G
google
541
3
Gemma 3 1b It Qat Int4 Unquantized
Gemma是Google推出的輕量級先進開放模型系列,基於與Gemini相同技術構建,支持多模態輸入和文本生成。
大型語言模型 Transformers
G
google
507
3
Gemma 3 1b It Qat Q4 0 Unquantized
Gemma 3是Google推出的輕量級開源多模態模型系列,基於Gemini技術構建,支持文本和圖像輸入,生成文本輸出。1B版本經過指令調優和量化感知訓練(QAT),適合資源有限環境部署。
圖像生成文本 Transformers
G
google
246
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase