# 原生多模態預訓練

Internvl3 38B Instruct GGUF
Apache-2.0
InternVL3-38B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的整體性能,具備強大的多模態感知和推理能力。
圖像生成文本 Transformers
I
unsloth
1,236
2
Internvl3 8B
Apache-2.0
InternVL3-8B 是一款先進的多模態大語言模型,具備卓越的多模態感知和推理能力,能處理圖像、視頻等多模態數據。
多模態對齊 Transformers
I
unsloth
224
1
Internvl3 1B GGUF
Apache-2.0
InternVL3-1B是一款先進的多模態大語言模型,在多模態感知、推理等能力上表現出色,還拓展了工具使用、GUI代理等多模態能力。
多模態融合 Transformers
I
unsloth
868
2
Internvl3 9B AWQ
MIT
InternVL3-9B是InternVL3系列中的一款多模態大語言模型,具備卓越的多模態感知與推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等多種應用場景。
文本生成圖像 Transformers 其他
I
OpenGVLab
214
1
Internvl3 8B AWQ
其他
InternVL3-8B是OpenGVLab推出的先進多模態大語言模型,具備強大的多模態感知與推理能力,支持工具調用、GUI智能體、工業圖像分析、3D視覺感知等新領域。
圖像生成文本 Transformers 其他
I
OpenGVLab
1,441
3
Internvl3 2B AWQ
其他
InternVL3-2B是OpenGVLab推出的先進多模態大語言模型(MLLM),具備卓越的多模態感知和推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等。
Transformers 其他
I
OpenGVLab
677
1
Internvl3 1B AWQ
其他
InternVL3-1B是InternVL3系列中的多模態大語言模型,具有卓越的多模態感知和推理能力。
文本生成圖像 Transformers 其他
I
OpenGVLab
303
1
Internvl3 2B Pretrained
Apache-2.0
InternVL3-2B是OpenGVLab推出的先進多模態大語言模型,具備強大的視覺語言理解和推理能力,支持多種多模態任務。
文本生成圖像 Transformers 其他
I
OpenGVLab
61
1
Internvl3 1B Pretrained
其他
InternVL3-1B是OpenGVLab推出的先進多模態大語言模型,已完成原生多模態預訓練但未進行後訓練。
文本生成圖像 Transformers 其他
I
OpenGVLab
18
2
Internvl3 9B Instruct
MIT
InternVL3-9B-Instruct 是 InternVL3 系列的監督微調版本,具備強大的多模態感知和推理能力,支持圖像、文本、視頻等多種模態處理。
圖像生成文本 Transformers 其他
I
OpenGVLab
220
2
Internvl3 8B Instruct
其他
InternVL3-8B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的多模態感知和推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等多種功能。
圖像生成文本 Transformers 其他
I
OpenGVLab
885
2
Internvl3 38B Instruct
Apache-2.0
InternVL3-38B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的多模態感知和推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等多種任務。
文本生成圖像 Transformers 其他
I
OpenGVLab
468
3
Internvl3 2B Instruct
Apache-2.0
InternVL3-2B-Instruct是基於InternVL3-2B的監督微調版本,經過原生多模態預訓練和SFT處理,具備強大的多模態感知和推理能力。
文本生成圖像 Transformers 其他
I
OpenGVLab
1,345
4
Internvl3 1B Instruct
Apache-2.0
InternVL3-1B-Instruct 是 InternVL3 系列的監督微調版本,基於原生多模態預訓練,具備卓越的多模態感知和推理能力。
圖像生成文本 Transformers 其他
I
OpenGVLab
705
5
Internvl3 78B Instruct
其他
InternVL3-78B-Instruct是OpenGVLab推出的先進多模態大語言模型,展示了卓越的多模態感知和推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等多種任務。
圖像生成文本 Transformers 其他
I
OpenGVLab
345
5
Internvl3 1B
其他
InternVL3-1B是InternVL3系列中的1B參數規模多模態大語言模型,整合了InternViT視覺編碼器和Qwen2.5語言模型,具備卓越的多模態感知和推理能力。
Transformers 其他
I
FriendliAI
71
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase