I

Internvl3 14B Hf

由OpenGVLab開發
InternVL3-14B是一個強大的多模態大語言模型,在多模態感知和推理能力上表現卓越,支持圖像、文本、視頻等多種輸入。
下載量 4,260
發布時間 : 4/18/2025

模型概述

InternVL3-14B是一個功能強大的多模態大語言模型,具備卓越的多模態感知和推理能力,支持圖像、文本、視頻等多種輸入,適用於工具使用、GUI代理、工業圖像分析、3D視覺感知等多個領域。

模型特點

多模態能力強
相比InternVL 2.5,InternVL3展現出更出色的多模態感知和推理能力,還將多模態能力擴展到工具使用、GUI代理、工業圖像分析、3D視覺感知等領域。
文本性能優
與Qwen2.5聊天模型對比,得益於原生多模態預訓練,InternVL3系列在整體文本性能上表現更優。
支持多種輸入
支持圖像、文本、視頻的單輸入、批量輸入以及交錯輸入。

模型能力

圖像描述
文本生成
視頻分析
多模態推理
工具使用
GUI代理
工業圖像分析
3D視覺感知

使用案例

圖像分析
圖像描述
對輸入的圖像進行詳細描述
生成詳細的圖像描述文本
文本生成
詩歌生成
根據提示生成詩歌
生成符合要求的詩歌文本
視頻分析
視頻內容理解
分析視頻內容並回答問題
準確回答關於視頻內容的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase