L

Llama 4 Scout 17B 16E Instruct

meta-llamaによって開発
Llama 4 ScoutはMetaが開発したマルチモーダルAIモデルで、混合専門家アーキテクチャを採用し、12言語のテキストと画像インタラクションをサポート、17Bの活性化パラメータと109Bの総パラメータを有します。
ダウンロード数 817.62k
リリース時間 : 4/2/2025

モデル概要

ネイティブマルチモーダル大規模言語モデルで、テキストと画像理解において業界をリードする性能を持ち、商用および研究用途をサポートします。

モデル特徴

マルチモーダルサポート
テキストと画像入力を同時処理し、クロスモーダル理解と生成を実現
混合専門家アーキテクチャ
16専門家構成を採用、17B活性化パラメータを維持しながら109B総パラメータ容量を実現
長文コンテキスト処理
10Mトークンのコンテキストウィンドウをサポート、長文書や複雑タスクに適応
多言語能力
12言語をネイティブサポート、アジア・ヨーロッパ主要言語をカバー

モデル能力

多言語テキスト生成
画像内容理解
クロスモーダル推論
コード生成
長文書翻訳
視覚的質問応答

使用事例

インテリジェントアシスタント
マルチモーダルチャットボット
ユーザーがアップロードした画像とテキスト質問を同時処理
視覚情報を統合した自然言語回答を生成可能
コンテンツ分析
クロスメディアコンテンツ理解
画像とテキスト混合コンテンツの関係性と意味を分析
広告コンプライアンスチェックなどの商用シナリオを実現
教育
数学視覚問題解決
数学式や図表を含む問題を解析
MathVistaベンチマークで70.7点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase