Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
下载量 167
发布时间 : 7/23/2025
模型简介
这是一个视觉语言模型,专门用于图像描述等视觉理解任务,支持英语、中文和泰语。
模型特点
多语言支持
支持英语、中文和泰语三种语言的图像描述生成。
多种量化版本
提供多种量化版本,适应不同硬件和性能需求。
视觉理解能力
能够理解图像内容并生成准确的描述。
模型能力
图像描述生成
多语言文本生成
视觉内容理解
使用案例
图像描述
自动图像标注
为图像生成描述性文本,用于内容管理和检索。
辅助视觉障碍人士
通过语音合成将图像内容描述给视觉障碍用户。
多语言应用
跨语言内容生成
为同一图像生成不同语言的描述。
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2