Gemma 3 27b It Quantized.w4a16
這是google/gemma-3-27b-it的量化版本,支持視覺-文本輸入和文本輸出,通過權重量化和激活量化優化,可使用vLLM進行高效推理。
圖像生成文本
Transformers

G
RedHatAI
302
1
Nvidia.cosmos Reason1 7B GGUF
Cosmos-Reason1-7B是英偉達發佈的7B參數規模的基礎模型,專注於圖文轉文本任務。
大型語言模型
N
DevQuasar
287
1
Devstral Small Vision 2505 GGUF
Apache-2.0
基於Mistral Small模型的視覺編碼器,支持圖像文本生成任務,適配llama.cpp框架
圖像生成文本
D
ngxson
777
20
Fastvlm 0.5B Stage3
其他
FastVLM-0.5B-Stage3 是一個高效的多模態語言模型,具備視覺理解和語言處理能力,能夠處理長視頻並生成結構化輸出。
圖像生成文本
Transformers 英語

F
zhaode
174
1
Fastvlm 0.5B Stage2
其他
FastVLM-0.5B-Stage2是一個高效的多模態語言模型,能夠理解視覺內容並處理文本任務。
多模態融合
Transformers 英語

F
zhaode
103
1
Magma 8B GGUF
MIT
Magma-8B是一個基於GGUF格式的圖像文本到文本轉換模型,適用於多模態任務處理。
圖像生成文本
M
Mungert
545
1
Typhoon Ocr 7b
專為泰英雙語現實場景文檔解析打造的視覺語言模型,基於Qwen2.5-VL-Instruction框架
圖像生成文本
Transformers 支持多種語言

T
scb10x
126
9
Gemma 3 1b It Qat Bnb 4bit
Gemma 3是Google推出的輕量級開放模型系列,基於Gemini技術構建,支持多模態輸入和文本輸出。
圖像生成文本
Transformers

G
unsloth
23
1
Qwen Qwen2.5 VL 72B Instruct GGUF
其他
Qwen2.5-VL-72B-Instruct的多模態大語言模型量化版本,支持圖像文本到文本任務,適用於多種量化級別,從高精度到低內存需求。
文本生成圖像 英語
Q
bartowski
1,336
1
Qwen Qwen2.5 VL 7B Instruct GGUF
Apache-2.0
Qwen2.5-VL-7B-Instruct的量化版本,使用llama.cpp進行量化,支持多模態任務,適用於圖文轉文本等應用場景。
文本生成圖像 英語
Q
bartowski
2,056
2
Vilt Finetuned 100
Apache-2.0
基於ViLT-B32-MLM模型在VQA數據集上微調的視覺語言模型
文本生成圖像
Transformers

V
bangbrecho
15
0
TEMPURA Qwen2.5 VL 3B S1
TEMPURA是一個結合因果推理與細粒度時間分割的視頻時序理解框架,通過兩階段訓練提升視頻事件理解能力
視頻生成文本
Transformers

T
andaba
16
0
Qwen2.5 Vl 7b Cam Motion Preview
其他
基於Qwen2.5-VL-7B-Instruct微調的攝像機運動分析模型,專注於視頻中的攝像機運動分類和視頻-文本檢索任務
視頻生成文本
Transformers

Q
chancharikm
1,456
10
Webssl Dino7b Full8b 518
基於80億MetaCLIP數據訓練的70億參數視覺Transformer模型,採用DINOv2自監督學習框架,無需語言監督
圖像分類
Transformers

W
facebook
157
7
Gemma 3 12b It Qat Int4 GGUF
Gemma 3是谷歌基於Gemini技術構建的輕量級開放模型系列,12B版本採用量化感知訓練(QAT)技術,支持多模態輸入和128K上下文窗口。
文本生成圖像
G
unsloth
1,921
3
Gemma 3 27b It Qat Unsloth Bnb 4bit
Gemma 3是Google推出的輕量級、最先進的多模態開源模型,能夠處理文本和圖像輸入並生成文本輸出。
圖像生成文本
Transformers

G
unsloth
2,591
1
Gemma 3 27b It Qat GGUF
Gemma 3是Google基於Gemini技術構建的輕量級開放模型系列,支持多模態輸入和文本輸出,具有128K大上下文窗口和140+語言支持。
文本生成圖像 英語
G
unsloth
2,683
3
Gemma 3 1b It Qat
Gemma 3是谷歌推出的輕量級多模態模型,能夠處理文本和圖像輸入並生成文本輸出。該模型具有128K大上下文窗口和超140種語言的多語言支持。
圖像生成文本
Transformers

G
unsloth
2,558
1
Gemma 3 4b It Qat Unsloth Bnb 4bit
Gemma 3是谷歌推出的輕量級前沿開放模型系列,基於Gemini模型技術構建,支持多模態輸入和文本輸出。
圖像生成文本
Transformers

G
unsloth
918
1
Gemma 3 12b It Qat Int4
Gemma 3是Google推出的輕量級開放模型系列,基於創建Gemini模型的研究和技術構建。12B版本是經過指令調優的多模態模型,支持文本和圖像輸入,生成文本輸出。
圖像生成文本
Transformers

G
unsloth
78
1
Gemma 3 27b It Qat
Gemma是Google推出的輕量級開放模型系列,基於Gemini模型技術構建。Gemma 3是多模態模型,支持文本和圖像輸入,生成文本輸出,具有128K大上下文窗口和多語言能力。
圖像生成文本
Transformers

G
unsloth
168
2
Gemma 3 12b It Qat Unsloth Bnb 4bit
Gemma 3是Google推出的輕量級、最先進的開放模型家族,基於與Gemini模型相同的研究和技術構建。支持多模態輸入和文本輸出。
圖像生成文本
Transformers

G
unsloth
1,422
1
Gemma 3 12b It Qat
Gemma 3是谷歌推出的輕量級、最先進的多模態開源模型,能處理文本和圖像輸入並生成文本輸出,適用於多種文本生成和圖像理解任務。
圖像生成文本
Transformers

G
unsloth
952
2
Blip Gqa Ft
MIT
基於Salesforce/blip2-opt-2.7b微調的視覺語言模型,用於圖像問答任務
文本生成圖像
Transformers

B
phucd
29
0
Blip Custom Captioning
Bsd-3-clause
BLIP是一個統一的視覺-語言預訓練框架,擅長圖像描述生成等視覺-語言任務
圖像生成文本
B
hiteshsatwani
78
0
Internvl3 8B 6bit
其他
InternVL3-8B-6bit 是一個基於 MLX 格式轉換的視覺語言模型,支持多語言圖像文本到文本的任務。
圖像生成文本
Transformers 其他

I
mlx-community
70
1
Gemma 3 12B It Qat GGUF
Gemma 3 12B IT是由谷歌開發的大語言模型,支持多模態輸入和長上下文處理。
圖像生成文本
G
lmstudio-community
36.65k
4
Gemma 3 4B It Qat GGUF
Google出品的Gemma 3 4B IT模型,支持多模態輸入和長上下文處理,適用於文本生成和圖像理解任務。
圖像生成文本
G
lmstudio-community
46.55k
10
Kimi VL A3B Thinking 8bit
其他
Kimi-VL-A3B-Thinking-8bit 是一個基於 MLX 格式轉換的多模態視覺語言模型,支持圖像文本到文本的生成任務。
圖像生成文本
Transformers 其他

K
mlx-community
1,738
1
Gemma 3 27b It Qat Bf16
Gemma 3 27B IT QAT BF16 是由 Google 發佈的 Gemma 系列模型的一個版本,經過量化感知訓練(QAT)並轉換為 BF16 格式,適用於 MLX 框架。
圖像生成文本
Transformers

G
mlx-community
178
2
Gemma 3 27b It Qat 3bit
其他
該模型是從 google/gemma-3-27b-it-qat-q4_0-unquantized 轉換為 MLX 格式的 3 位量化版本,適用於圖像文本到文本任務。
圖像生成文本
Transformers 其他

G
mlx-community
197
2
Gemma 3 27b It Qat 4bit
其他
Gemma 3 27B IT QAT 4bit 是一個基於 Google 原始模型轉換而來的 MLX 格式模型,支持圖像文本到文本的任務。
圖像生成文本
Transformers 其他

G
mlx-community
2,200
12
Mistral Small 3.1 24B Instruct 2503 Quantized.w8a8
Apache-2.0
這是一個經過INT8量化的Mistral-Small-3.1-24B-Instruct-2503模型,由Red Hat和Neural Magic優化,適用於快速響應和低延遲場景。
M
RedHatAI
833
2
Gemma 3 4b It Qat 4bit
其他
Gemma 3 4B IT QAT 4bit 是一個經過量化感知訓練(QAT)的4位量化大語言模型,基於Gemma 3架構,專為MLX框架優化。
圖像生成文本
Transformers 其他

G
mlx-community
607
1
Gemma 3 27b It Qat Q4 0 Unquantized
Gemma 3是Google推出的輕量級、先進的多模態開放模型,基於與Gemini模型相同的研究和技術構建,支持文本和圖像輸入並生成文本輸出。
文本生成圖像
Transformers

G
google
11.53k
23
Videochat R1 7B
Apache-2.0
VideoChat-R1_7B 是一個基於 Qwen2.5-VL-7B-Instruct 的多模態視頻理解模型,能夠處理視頻和文本輸入,生成文本輸出。
視頻生成文本
Transformers 英語

V
OpenGVLab
1,686
7
Gemma 3 4b It GPTQ 4b 128g
基於gemma-3-4b-it模型進行INT4量化的版本,顯著減少存儲和計算資源需求
圖像生成文本
Transformers

G
ISTA-DASLab
502
2
Gemma 3 12b It Qat Int4 Unquantized
Gemma 3是Google推出的輕量級多模態開放模型,支持文本和圖像輸入,生成文本輸出,具有128K大上下文窗口和多語言能力。
圖像生成文本
Transformers

G
google
1,358
9
Gemma 3 4b It Qat Int4 Unquantized
Gemma 3是Google推出的輕量級多模態開放模型,支持文本和圖像輸入,生成文本輸出。4B版本經過指令調優和量化感知訓練,適合資源有限環境部署。
圖像生成文本
Transformers

G
google
541
3
Gemma 3 27b It Qat Compressed Tensors
Gemma 3 是 Google 推出的輕量級先進開放模型系列,基於與 Gemini 模型相同的研究和技術構建。此版本為 27B 參數的指令調優模型,採用量化感知訓練(QAT)和壓縮張量技術。
圖像生成文本
G
gaunernst
1,985
6
- 1
- 2
- 3
- 4
- 5
- 6
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98