I

Internvl3 8B

unslothによって開発
InternVL3-8Bは、高度なマルチモーダル大規模言語モデルで、卓越したマルチモーダル感知と推論能力を備え、画像や動画などのマルチモーダルデータを処理できます。
ダウンロード数 224
リリース時間 : 5/18/2025

モデル概要

InternVL3-8Bはマルチモーダル大規模言語モデルで、画像や動画などのマルチモーダルデータ処理をサポートし、ツール使用、GUIエージェント、産業用画像分析などの分野で優れた性能を発揮します。

モデル特徴

卓越した性能
InternVL 2.5と比較して、InternVL3はより優れたマルチモーダル感知と推論能力を示します。
多言語対応
複数の言語をサポートし、より広範なアプリケーションシーンを持ちます。
効率的な学習
ネイティブマルチモーダル事前学習方法を採用し、言語と視覚学習を1つの事前学習段階に統合します。
可変視覚位置符号化(V2PE)
より小さく、より柔軟な位置増分を使用し、長文脈理解能力を向上させます。

モデル能力

マルチモーダル感知
マルチモーダル推論
画像処理
動画処理
ツール使用
GUIエージェント
産業用画像分析
3Dビジョン感知

使用事例

産業応用
産業用画像分析
産業シーンにおける画像認識と分析タスクに使用されます。
人機インタラクション
GUIエージェント
グラフィカルユーザーインターフェイスの自動操作とインタラクションをサポートします。
マルチメディア処理
動画理解
動画データを処理し分析し、重要な情報を抽出します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase