# 图像文本转换

Google.gemma 3 4b It Qat Int4 Unquantized GGUF
基于Gemma 3 4B的量化版本图像文本转文本模型,旨在让知识为大众所用
图像生成文本
G
DevQuasar
161
1
Gemma 3 12B It Qat GGUF
Gemma 3 12B IT是由谷歌开发的大语言模型,支持多模态输入和长上下文处理。
图像生成文本
G
lmstudio-community
36.65k
4
Llama 4 Scout 17b 16e It Gguf
其他
基于Meta Llama基础模型构建的图像文本到文本转换模型,支持通过gguf-connector和llama-cpp-python进行交互。
图像生成文本
L
chatpig
258
0
Gemma 3 Glitter 4B
基于Gemma 3 4B模型,采用与Glitter 12b相同的数据混合方案优化的模型
大型语言模型 Safetensors
G
allura-org
140
3
Gemma 3 27b It GGUF
Gemma-3-27b-it是Google发布的27B参数规模的量化版本大语言模型,专注于图像文本转换任务。
大型语言模型 Transformers
G
gaianet
2,047
0
Gemma 3 4b It GGUF
Gemma-3-4b-it-GGUF 是对 Google 的 Gemma-3-4b-it 模型进行量化处理的版本,使其能在 LlamaEdge 上运行,适用于图像文本到文本的转换任务。
图像文本到文本 Transformers
G
second-state
2,120
0
Huihui Ai.granite Vision 3.2 2b Abliterated GGUF
Granite Vision 3.2 2B Abliterated 是一个视觉语言模型,专注于图像文本转文本任务。
图像生成文本
H
DevQuasar
724
1
Ibm Granite.granite Vision 3.2 2b GGUF
Granite Vision 3.2 2B 是 IBM 开发的一个视觉语言模型,专注于图像文本转文本任务。
图像生成文本
I
DevQuasar
211
1
Hermesflow
Apache-2.0
赫尔墨斯流是一个通用的多模态大语言模型对齐框架,能够自主生成同源偏好数据,并通过自我博弈迭代优化与配对DPO技术,无缝弥合多模态理解与生成的鸿沟。
图像生成文本
H
Gen-Verse
218
4
Minicpm V 2 6 GGUF
其他
MiniCPM-V-2_6的GGUF量化版本,基于llama.cpp实现高效图像文本转换
图像生成文本
M
AI-Engine
107
0
Llava Maid 7B DPO GGUF
LLaVA 是一个大型语言和视觉助手模型,能够处理图像和文本的多模态任务。
图像生成文本
L
megaaziib
99
4
Git Base Textcaps
MIT
GIT是一个基于Transformer的生成式图像到文本模型,能够将视觉内容转换为描述性文本。
图像生成文本 Transformers 支持多种语言
G
microsoft
482
8
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase