L

Llama 4 Maverick 17B 128E Instruct FP8

meta-llamaによって開発
Llama 4シリーズはMetaが開発したマルチモーダルAIモデルで、テキストと画像のインタラクションをサポートし、混合エキスパートアーキテクチャ(MoE)を採用しており、テキストと画像理解において業界をリードする性能を発揮します。
ダウンロード数 64.29k
リリース時間 : 4/1/2025

モデル概要

ネイティブマルチモーダルAIモデルで、12言語のテキストと画像インタラクションをサポートし、商用・研究用途の多言語アプリケーション、会話アシスタント、視覚推論などのシナリオに適しています。

モデル特徴

混合エキスパートアーキテクチャ(MoE)
128エキスパート構成を採用し、効率的なパラメータ利用を実現、計算コストとモデル性能のバランスを取ります
マルチモーダルサポート
テキストと画像の入出力をネイティブサポートし、クロスモーダル理解と生成能力を備えています
長文脈処理
1Mトークンのコンテキストウィンドウをサポートし、長文書類や複雑な推論タスクに適しています
多言語最適化
12言語に対して特別な最適化を行い、世界の主要言語をカバーしています

モデル能力

多言語テキスト生成
画像認識と説明
クロスモーダル推論
コード生成と補完
長文書処理
指示追従

使用事例

商用アプリケーション
多言語カスタマーサポートアシスタント
12言語のリアルタイム会話と画像補助説明をサポート
MMMUベンチマークで73.4%の精度を達成
文書インテリジェント処理
図文混在の長文書(契約書、レポートなど)を解析
10Mトークンのコンテキストウィンドウをサポート
研究開発
合成データ生成
モデル出力を通じて他のAIモデルのトレーニングデータを改善
プロトコルの注記要件に従う必要があります
視覚質問応答システム
画像理解に基づくインテリジェントQAアプリケーションを構築
DocVQAベンチマークANLSスコア89.4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase