Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
下載量 167
發布時間 : 7/23/2025
模型概述
這是一個視覺語言模型,專門用於圖像描述等視覺理解任務,支持英語、中文和泰語。
模型特點
多語言支持
支持英語、中文和泰語三種語言的圖像描述生成。
多種量化版本
提供多種量化版本,適應不同硬件和性能需求。
視覺理解能力
能夠理解圖像內容並生成準確的描述。
模型能力
圖像描述生成
多語言文本生成
視覺內容理解
使用案例
圖像描述
自動圖像標註
為圖像生成描述性文本,用於內容管理和檢索。
輔助視覺障礙人士
通過語音合成將圖像內容描述給視覺障礙用戶。
多語言應用
跨語言內容生成
為同一圖像生成不同語言的描述。
精選推薦AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
圖像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
這是一個基於Qwen2.5-VL-7B模型的靜態量化版本,專注於圖像描述生成任務,支持多種語言。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
圖像生成文本
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型,在移動設備上也能高效運行。
大型語言模型
Transformers 英語

L
Mungert
263
2