Llama 3.2 Instruct 3B

Llama 3.2 3B Instructは大規模言語モデルで、128Kトークンのコンテキスト長をサポートし、要約、命令追跡、エッジでローカル実行される書き換えなどのデバイス上のユースケースにおいて最先端の技術を持っています。

インテリジェンス(弱い)

速度(中程度)

入力サポートモダリティ

いいえ

推論モデルかどうか

128,000

コンテキストウィンドウ

128,000

最大出力トークン

2023-12-01

知識カットオフ

価格設定

￥0.14 /M tokens

入力

￥0.14 /M tokens

出力

￥0.25 /M tokens

混合価格

クイック簡易比較

Llama 4 Scout

￥0.08

Llama 4 Maverick

￥0.17

Llama 3.1 Instruct 8B

￥0.03

基本パラメータ

GPT-4.1技術パラメータ

パラメータ数

3,210.0M

コンテキスト長

128.00k tokens

トレーニングデータカットオフ

2023-12-01

オープンソースカテゴリ

Open Weights (Permissive License)

マルチモーダルサポート

テキストのみ

スループット

171

リリース日

2024-09-25

応答速度

122.41,885 tokens/s

ベンチマークスコア

以下はclaude-monetの様々な標準ベンチマークテストでのパフォーマンスです。これらのテストは、異なるタスクやドメインにおけるモデルの能力を評価します。

インテリジェンス指数

大規模言語モデルインテリジェンスレベル

1952

大規模言語モデルインテリジェンスレベル

コーディング指数

コーディングタスクにおけるAIモデルのパフォーマンス指標

673

コーディングタスクにおけるAIモデルのパフォーマンス指標

数学指数

数学的問題の解決、数学的推論、または数学関連タスクの実行における能力指標

MMLU Pro

大規模マルチタスクマルチモーダル理解 - テキスト、画像、音声、ビデオの理解をテスト

34.7

大規模マルチタスクマルチモーダル理解 - テキスト、画像、音声、ビデオの理解をテスト

GPQA

大学院物理学問題評価 - ダイヤモンド科学レベルの問題で高度な物理学知識をテスト

25.5

大学院物理学問題評価 - ダイヤモンド科学レベルの問題で高度な物理学知識をテスト

HLE

Hugging Face Open LLMリーダーボードにおけるモデルの包括的な平均スコア

5.2

Hugging Face Open LLMリーダーボードにおけるモデルの包括的な平均スコア

LiveCodeBench

実世界のコード作成とプログラミングコンテスト問題解決における大規模言語モデルの能力を評価する特定の評価

8.3

実世界のコード作成とプログラミングコンテスト問題解決における大規模言語モデルの能力を評価する特定の評価

SciCode

科学計算または特定の科学分野のコード生成におけるモデルの能力

5.2

科学計算または特定の科学分野のコード生成におけるモデルの能力

HumanEval

特定のHumanEvalベンチマークテストセットでAIモデルが達成したスコア

55.7

特定のHumanEvalベンチマークテストセットでAIモデルが達成したスコア

Math 500スコア

最初の500の大規模でよく知られた数学ベンチマークテストのスコア

48.9

最初の500の大規模でよく知られた数学ベンチマークテストのスコア

AIMEスコア

高難度の数学競技問題（特にAIMEレベル）を解決するAIモデルの能力を測定する指標

6.7

高難度の数学競技問題（特にAIMEレベル）を解決するAIモデルの能力を測定する指標

おすすめAIモデル

Qwen2.5 Coder Instruct 32B

Gemini 1.5 Pro (May '24)

Llama 3.2 Instruct 11B (Vision)