# 原生多模态预训练

Internvl3 38B Instruct GGUF
Apache-2.0
InternVL3-38B-Instruct 是一个先进的多模态大语言模型(MLLM),展示了卓越的整体性能,具备强大的多模态感知和推理能力。
图像生成文本 Transformers
I
unsloth
1,236
2
Internvl3 8B
Apache-2.0
InternVL3-8B 是一款先进的多模态大语言模型,具备卓越的多模态感知和推理能力,能处理图像、视频等多模态数据。
多模态对齐 Transformers
I
unsloth
224
1
Internvl3 1B GGUF
Apache-2.0
InternVL3-1B是一款先进的多模态大语言模型,在多模态感知、推理等能力上表现出色,还拓展了工具使用、GUI代理等多模态能力。
多模态融合 Transformers
I
unsloth
868
2
Internvl3 9B AWQ
MIT
InternVL3-9B是InternVL3系列中的一款多模态大语言模型,具备卓越的多模态感知与推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种应用场景。
文本生成图像 Transformers 其他
I
OpenGVLab
214
1
Internvl3 8B AWQ
其他
InternVL3-8B是OpenGVLab推出的先进多模态大语言模型,具备强大的多模态感知与推理能力,支持工具调用、GUI智能体、工业图像分析、3D视觉感知等新领域。
图像生成文本 Transformers 其他
I
OpenGVLab
1,441
3
Internvl3 1B AWQ
其他
InternVL3-1B是InternVL3系列中的多模态大语言模型,具有卓越的多模态感知和推理能力。
文本生成图像 Transformers 其他
I
OpenGVLab
303
1
Internvl3 2B AWQ
其他
InternVL3-2B是OpenGVLab推出的先进多模态大语言模型(MLLM),具备卓越的多模态感知和推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等。
图像文本到文本 Transformers 其他
I
OpenGVLab
677
1
Internvl3 2B Pretrained
Apache-2.0
InternVL3-2B是OpenGVLab推出的先进多模态大语言模型,具备强大的视觉语言理解和推理能力,支持多种多模态任务。
文本生成图像 Transformers 其他
I
OpenGVLab
61
1
Internvl3 1B Pretrained
其他
InternVL3-1B是OpenGVLab推出的先进多模态大语言模型,已完成原生多模态预训练但未进行后训练。
文本生成图像 Transformers 其他
I
OpenGVLab
18
2
Internvl3 9B Instruct
MIT
InternVL3-9B-Instruct 是 InternVL3 系列的监督微调版本,具备强大的多模态感知和推理能力,支持图像、文本、视频等多种模态处理。
图像生成文本 Transformers 其他
I
OpenGVLab
220
2
Internvl3 8B Instruct
其他
InternVL3-8B-Instruct 是一个先进的多模态大语言模型(MLLM),展示了卓越的多模态感知和推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种功能。
图像生成文本 Transformers 其他
I
OpenGVLab
885
2
Internvl3 38B Instruct
Apache-2.0
InternVL3-38B-Instruct 是一个先进的多模态大语言模型(MLLM),展示了卓越的多模态感知和推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种任务。
文本生成图像 Transformers 其他
I
OpenGVLab
468
3
Internvl3 2B Instruct
Apache-2.0
InternVL3-2B-Instruct是基于InternVL3-2B的监督微调版本,经过原生多模态预训练和SFT处理,具备强大的多模态感知和推理能力。
文本生成图像 Transformers 其他
I
OpenGVLab
1,345
4
Internvl3 1B Instruct
Apache-2.0
InternVL3-1B-Instruct 是 InternVL3 系列的监督微调版本,基于原生多模态预训练,具备卓越的多模态感知和推理能力。
图像生成文本 Transformers 其他
I
OpenGVLab
705
5
Internvl3 78B Instruct
其他
InternVL3-78B-Instruct是OpenGVLab推出的先进多模态大语言模型,展示了卓越的多模态感知和推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种任务。
图像生成文本 Transformers 其他
I
OpenGVLab
345
5
Internvl3 8B
其他
InternVL3-8B是一款先进的多模态大语言模型,具备卓越的多模态感知和推理能力,在工具使用、GUI代理、工业图像分析等多领域表现出色。
多模态融合 Transformers 其他
I
FriendliAI
167
0
Internvl3 1B
其他
InternVL3-1B是InternVL3系列中的1B参数规模多模态大语言模型,整合了InternViT视觉编码器和Qwen2.5语言模型,具备卓越的多模态感知和推理能力。
图像文本到文本 Transformers 其他
I
FriendliAI
71
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase