原生多模态预训练

# 原生多模态预训练

Internvl3 38B Instruct GGUF

InternVL3-38B-Instruct 是一个先进的多模态大语言模型（MLLM），展示了卓越的整体性能，具备强大的多模态感知和推理能力。

图像生成文本

InternVL3-8B 是一款先进的多模态大语言模型，具备卓越的多模态感知和推理能力，能处理图像、视频等多模态数据。

多模态对齐

Internvl3 1B GGUF

InternVL3-1B是一款先进的多模态大语言模型，在多模态感知、推理等能力上表现出色，还拓展了工具使用、GUI代理等多模态能力。

多模态融合

Internvl3 9B AWQ

InternVL3-9B是InternVL3系列中的一款多模态大语言模型，具备卓越的多模态感知与推理能力，支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种应用场景。

文本生成图像

Transformers 其他

Internvl3 8B AWQ

InternVL3-8B是OpenGVLab推出的先进多模态大语言模型，具备强大的多模态感知与推理能力，支持工具调用、GUI智能体、工业图像分析、3D视觉感知等新领域。

图像生成文本

Transformers 其他

Internvl3 1B AWQ

InternVL3-1B是InternVL3系列中的多模态大语言模型，具有卓越的多模态感知和推理能力。

文本生成图像

Transformers 其他

Internvl3 2B AWQ

InternVL3-2B是OpenGVLab推出的先进多模态大语言模型（MLLM），具备卓越的多模态感知和推理能力，支持工具使用、GUI代理、工业图像分析、3D视觉感知等。

图像文本到文本

Transformers 其他

Internvl3 2B Pretrained

InternVL3-2B是OpenGVLab推出的先进多模态大语言模型，具备强大的视觉语言理解和推理能力，支持多种多模态任务。

文本生成图像

Transformers 其他

Internvl3 1B Pretrained

InternVL3-1B是OpenGVLab推出的先进多模态大语言模型，已完成原生多模态预训练但未进行后训练。

文本生成图像

Transformers 其他

Internvl3 9B Instruct

InternVL3-9B-Instruct 是 InternVL3 系列的监督微调版本，具备强大的多模态感知和推理能力，支持图像、文本、视频等多种模态处理。

图像生成文本

Transformers 其他

Internvl3 8B Instruct

InternVL3-8B-Instruct 是一个先进的多模态大语言模型（MLLM），展示了卓越的多模态感知和推理能力，支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种功能。

图像生成文本

Transformers 其他

Internvl3 38B Instruct

InternVL3-38B-Instruct 是一个先进的多模态大语言模型（MLLM），展示了卓越的多模态感知和推理能力，支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种任务。

文本生成图像

Transformers 其他

Internvl3 2B Instruct

InternVL3-2B-Instruct是基于InternVL3-2B的监督微调版本，经过原生多模态预训练和SFT处理，具备强大的多模态感知和推理能力。

文本生成图像

Transformers 其他

Internvl3 1B Instruct

InternVL3-1B-Instruct 是 InternVL3 系列的监督微调版本，基于原生多模态预训练，具备卓越的多模态感知和推理能力。

图像生成文本

Transformers 其他

Internvl3 78B Instruct

InternVL3-78B-Instruct是OpenGVLab推出的先进多模态大语言模型，展示了卓越的多模态感知和推理能力，支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种任务。

图像生成文本

Transformers 其他

InternVL3-8B是一款先进的多模态大语言模型，具备卓越的多模态感知和推理能力，在工具使用、GUI代理、工业图像分析等多领域表现出色。

多模态融合

Transformers 其他

InternVL3-1B是InternVL3系列中的1B参数规模多模态大语言模型，整合了InternViT视觉编码器和Qwen2.5语言模型，具备卓越的多模态感知和推理能力。

图像文本到文本

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase