I

Internvl3 38B Hf

由OpenGVLab開發
InternVL3-38B是一個先進的多模態大語言模型(MLLM),在多模態感知和推理能力上有顯著提升,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等領域。
下載量 2,226
發布時間 : 4/18/2025

模型概述

InternVL3-38B是一個多模態大語言模型,支持圖像、視頻和文本的聯合處理,具備強大的多模態推理能力。

模型特點

先進的多模態能力
相比前代模型,在多模態感知和推理能力上有顯著提升,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等領域。
高效的批量推理
作為原生的Transformers模型,支持多種注意力機制的實現(包括SDPA和FA2),並能高效地處理包含圖像、視頻和文本的批量輸入。
多語言支持
支持多種語言,適用於不同地區的用戶。

模型能力

圖像描述生成
視頻內容理解
多模態推理
工具使用
GUI代理
工業圖像分析
3D視覺感知
文本生成

使用案例

圖像理解
圖像描述生成
對輸入的圖像生成詳細的描述。
生成準確且詳細的圖像描述。
視頻理解
視頻內容分析
對輸入的視頻內容進行分析和描述。
準確識別視頻中的動作和內容。
多模態交互
多模態聊天
支持圖像、視頻和文本的聯合輸入和交互。
實現自然的多模態對話。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase