# 動態分辨率處理

Internvl3 38B Instruct GGUF
Apache-2.0
InternVL3-38B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的整體性能,具備強大的多模態感知和推理能力。
圖像生成文本 Transformers
I
unsloth
1,236
2
Internvl3 1B Pretrained
其他
InternVL3-1B是OpenGVLab推出的先進多模態大語言模型,已完成原生多模態預訓練但未進行後訓練。
文本生成圖像 Transformers 其他
I
OpenGVLab
18
2
Biqwen2 V0.1
Apache-2.0
BiQwen2是基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,專注於高效視覺文檔檢索。
文本生成圖像 英語
B
vidore
460
0
Qwen2.5 VL Instruct 3B Geo
Apache-2.0
Qwen2.5-VL是Qwen家族的最新視覺語言模型,專注於增強視覺理解和代理能力。
文本生成圖像 Transformers 英語
Q
kxxinDave
29
2
Colqwen2.5 3b Multilingual V1.0 Merged
MIT
基於Qwen2.5-VL-3B-Instruct與ColBERT策略的多語言視覺檢索模型,支持動態輸入圖像分辨率,生成ColBERT風格的多向量文本與圖像表徵。
文本生成圖像 Transformers 支持多種語言
C
tsystems
70
0
Qwen2.5 VL 72B Instruct AWQ Fix
其他
Qwen2.5-VL 是 Qwen 家族的最新視覺語言模型,具備強大的視覺理解和代理能力,支持多格式視覺定位和結構化輸出生成。
圖像生成文本 Transformers 英語
Q
Benasd
94
1
Colqwen2.5 7b Multilingual V1.0
MIT
基於Qwen2.5-VL-7B-Instruct並採用ColBERT策略的多語言視覺檢索模型,在Vidore基準測試中排名第一
文本生成圖像 支持多種語言
C
Metric-AI
4,699
7
Colqwen2.5 3b Multilingual V1.0
MIT
基於Qwen2.5-VL-3B-Instruct並採用ColBERT策略的多語言視覺檢索器,在Vidore基準測試中表現優異
文本生成圖像 支持多種語言
C
Metric-AI
2,475
7
Qwen2.5 VL 72B Instruct Pointer AWQ
其他
Qwen2.5-VL是Qwen家族的最新視覺語言模型,具備增強的視覺理解、代理能力和結構化輸出生成功能。
圖像生成文本 Transformers 英語
Q
PointerHQ
5,592
8
Uground V1 72B Preview
其他
Qwen2-VL是Qwen-VL模型系列的最新迭代,具備全分辨率圖像理解、超長視頻解析和多語言圖文識別能力。
圖像生成文本 Transformers 英語
U
osunlp
21
2
Uground V1 2B
Apache-2.0
UGround是一個強大的GUI視覺定位模型,採用簡單的方法進行訓練,由OSUNLP和Orby AI合作完成。
多模態融合 Transformers 英語
U
osunlp
975
8
Uground V1 7B
Apache-2.0
UGround是一款採用簡單配方訓練的強大GUI視覺定位模型,由OSU NLP Group與Orby AI合作完成。
圖像生成文本 Transformers 英語
U
osunlp
2,053
12
Colqwen2 2b V1.0
基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,能夠生成多向量文本與圖像表示
文本生成圖像 支持多種語言
C
tsystems
700
1
Colqwen2 V1.0
Apache-2.0
ColQwen2是基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,用於高效索引文檔的視覺特徵。
文本生成圖像 英語
C
vidore
106.85k
86
Colqwen2 V0.1
Apache-2.0
基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,能高效通過視覺特徵索引文檔
文本生成圖像 Safetensors 英語
C
vidore
21.25k
170
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase