I

Internvl3 78B Hf

由OpenGVLab開發
InternVL3 是一個先進的多模態大語言模型系列,具備強大的多模態感知和推理能力,支持圖像、視頻和文本輸入。
下載量 40
發布時間 : 4/18/2025

模型概述

InternVL3 是 OpenGVLab 推出的多模態大語言模型,展現出卓越的整體性能。該模型支持圖像、視頻和文本輸入,具備強大的多模態感知和推理能力,適用於多種視覺-語言任務。

模型特點

多模態感知
支持圖像、視頻和文本輸入,具備強大的多模態感知能力。
高效推理
支持批量推理,可處理交錯的圖像、視頻和文本輸入。
廣泛的應用場景
適用於工具使用、GUI 代理、工業圖像分析、3D 視覺感知等多種場景。
性能優越
在整體文本性能上優於 Qwen2.5 系列。

模型能力

圖像描述
視頻理解
文本生成
多模態推理
批量處理

使用案例

圖像理解
圖像描述
對輸入的圖像進行詳細描述。
生成準確且詳細的圖像描述文本。
地標識別
識別圖像中的著名地標。
準確識別並描述地標特徵。
視頻理解
動作識別
識別視頻中的動作或行為。
準確描述視頻中的動作類型。
創意生成
俳句創作
根據圖像或文本提示創作俳句。
生成富有詩意的俳句文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase