3

360VL 8B

qihoo360によって開発
360VLはLLama3言語モデルをベースに開発されたマルチモーダルモデルで、強力な画像理解とバイリンガル対話能力を備えています。
ダウンロード数 22
リリース時間 : 5/16/2024

モデル概要

360VLはオープンソースの大型マルチモーダルモデルで、LLama3言語モデルをベースに開発され、グローバル感知のマルチブランチ投影器アーキテクチャを設計し、中英バイリンガル対話と画像理解をサポートしています。

モデル特徴

複数回の画像とテキストの対話
テキストと画像の入力を同時に受け取り、テキスト内容を出力でき、単一画像の複数回のビジュアル質問応答をサポートします。
バイリンガルテキスト対応
中英バイリンガル対話をサポートし、画像内の文字認識も含みます。
強力な画像理解
ビジュアルコンテンツの分析に長け、画像情報の抽出、整理、要約などのタスクを効率的に完了できます。
高精細画像解像度
672×672のより高解像度の画像理解をサポートします。

モデル能力

マルチモーダル対話
画像理解
ビジュアル質問応答
バイリンガルテキスト処理

使用事例

スマートカスタマーサービス
製品問い合わせ
ユーザーが製品画像をアップロードし、製品情報を尋ねる
モデルは製品を正確に識別し、関連情報を提供できます
教育
画像学習支援
学生が学習資料の画像をアップロードし、関連する質問をする
モデルは画像内容を理解し、質問に答えることができます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase