TVC 7B
TVC-7B 是基於 Qwen2-VL-7B-Instruct 的 70 億參數模型,支持中英雙語,具備 8K 標記的上下文窗口,擅長長鏈推理和多模態處理。
下載量 1,658
發布時間 : 3/6/2025
模型概述
TVC-7B 是一個多模態模型,能夠處理圖像到文本的轉換任務,特別適合需要長鏈推理的場景。
模型特點
長鏈推理能力
支持 8K 標記的上下文窗口,適合處理需要多步推理的複雜任務。
多模態處理
能夠同時處理圖像和文本輸入,實現圖像到文本的轉換。
雙語支持
支持中英雙語,適用於跨語言應用場景。
模型能力
圖像文本轉換
長鏈推理
多模態處理
中英雙語理解
使用案例
視覺問答
圖像內容推理
根據圖像內容進行多步推理,回答複雜問題。
能夠準確回答需要多步推理的視覺問題。
多模態交互
圖像描述生成
根據圖像生成詳細的文本描述。
生成準確且詳細的圖像描述。
精選推薦AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
圖像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
這是一個基於Qwen2.5-VL-7B模型的靜態量化版本,專注於圖像描述生成任務,支持多種語言。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
圖像生成文本
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型,在移動設備上也能高效運行。
大型語言模型
Transformers 英語

L
Mungert
263
2