I

Internvl3 38B

由FriendliAI開發
InternVL3-38B 是一款先進的多模態大語言模型,在多模態感知、推理等能力上表現卓越,相較於前代模型有顯著提升,還拓展了工具使用、GUI 代理等多模態能力。
下載量 166
發布時間 : 4/12/2025

模型概述

InternVL3-38B 是一款多模態大語言模型,具備強大的多模態感知和推理能力,支持工具使用、GUI 代理等多種應用場景。

模型特點

先進的多模態能力
相比 InternVL 2.5,InternVL3 展現出更出色的多模態感知和推理能力,還將多模態能力拓展到工具使用、GUI 代理、工業圖像分析、3D 視覺感知等領域。
優秀的語言性能
與 Qwen2.5 Chat 模型相比,得益於原生多模態預訓練,InternVL3 系列在整體文本性能上表現更優。
靈活的模型架構
採用“ViT - MLP - LLM”範式,集成新的增量預訓練 InternViT 和多種預訓練大語言模型,如 InternLM 3 和 Qwen 2.5。
高效的訓練策略
提出原生多模態預訓練方法,將語言和視覺學習整合到一個預訓練階段;在監督微調階段使用高質量、多樣化的訓練數據;採用混合偏好優化(MPO)方法提升推理性能。

模型能力

多模態感知
多模態推理
工具使用
GUI 代理
工業圖像分析
3D 視覺感知
文本生成
圖像分析

使用案例

多模態推理
多模態推理任務
在多個多模態推理基準測試中表現出色。
InternVL3-38B 比其對應模型高出 4.5 分。
GUI 操作
GUI 代理
支持 GUI 操作任務。
工業圖像分析
工業圖像分析
支持工業圖像分析任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase