Llama 4 ScoutマルチモーダルAIモデル - オープンソースで12言語のテキストと画像の相互作用をサポート

ホーム

Llama 4 Scout 17B 16E Instruct

meta-llamaによって開発

Llama 4 ScoutはMetaが開発したマルチモーダルAIモデルで、混合専門家アーキテクチャを採用し、12言語のテキストと画像インタラクションをサポート、17Bの活性化パラメータと109Bの総パラメータを有します。

マルチモーダル融合

Transformers

複数言語対応オープンソースライセンス:その他 #マルチモーダル混合専門家 #12言語ネイティブサポート #10M長文コンテキスト

ダウンロード数 817.62k

リリース時間 : 4/2/2025

モデル概要

ネイティブマルチモーダル大規模言語モデルで、テキストと画像理解において業界をリードする性能を持ち、商用および研究用途をサポートします。

モデル特徴

マルチモーダルサポート

テキストと画像入力を同時処理し、クロスモーダル理解と生成を実現

混合専門家アーキテクチャ

16専門家構成を採用、17B活性化パラメータを維持しながら109B総パラメータ容量を実現

長文コンテキスト処理

10Mトークンのコンテキストウィンドウをサポート、長文書や複雑タスクに適応

多言語能力

12言語をネイティブサポート、アジア・ヨーロッパ主要言語をカバー

モデル能力

多言語テキスト生成

画像内容理解

クロスモーダル推論

コード生成

長文書翻訳

視覚的質問応答

使用事例

インテリジェントアシスタント

マルチモーダルチャットボット

ユーザーがアップロードした画像とテキスト質問を同時処理

視覚情報を統合した自然言語回答を生成可能

コンテンツ分析

クロスメディアコンテンツ理解

画像とテキスト混合コンテンツの関係性と意味を分析

広告コンプライアンスチェックなどの商用シナリオを実現

教育

数学視覚問題解決

数学式や図表を含む問題を解析

MathVistaベンチマークで70.7点を達成

library_name: transformers language:

ar
de
en
es
fr
hi
id
it
pt
th
tl
vi base_model:
meta-llama/Llama-4-Scout-17B-16E tags:
facebook
meta
pytorch
llama
llama4 extra_gated_prompt: >- LLAMA 4 コミュニティライセンス契約

Llama 4 バージョン発効日: 2025年4月5日

「本契約」とは、Llama素材の使用、複製、頒布および改変に関する本契約に定める条件を意味します。

「ドキュメンテーション」とは、Metaがhttps://www.llama.com/docs/overviewで配布するLlama 4に付随する仕様書、マニュアルおよびドキュメンテーションを意味します。

「ライセンシー」または「あなた」とは、適用される法律、規則または規制の下で法的同意を提供するのに必要な年齢に達しており、あなたの雇用主またはその他の個人または団体（あなたがその個人または団体に代わって本契約を締結する場合）を法的に拘束する権限を有する、あなた、またはあなたの雇用主またはその他の個人または団体を意味します。

「Llama 4」とは、基盤となる大規模言語モデルおよびソフトウェアとアルゴリズム（機械学習モデルコード、訓練済みモデルウェイト、推論を可能にするコード、訓練を可能にするコード、ファインチューニングを可能にするコード、およびその他の要素を含む）を意味し、Metaがhttps://www.llama.com/llama-downloadsで配布するものです。

「Llama素材」とは、本契約の下で利用可能となるMetaの独自のLlama 4およびドキュメンテーション（およびその一部）を総称して意味します。

「Meta」または「当社」とは、Meta Platforms Ireland Limited（あなたがEEAまたはスイスに所在している場合、または団体の場合、主たる事業所がEEAまたはスイスにある場合）およびMeta Platforms, Inc.（あなたがEEAまたはスイスの外に所在している場合）を意味します。

下記の「同意する」をクリックするか、Llama素材のいかなる部分または要素を使用または頒布することにより、あなたは本契約に拘束されることに同意したものとみなされます。
1. ライセンス権利および再頒布
a. 権利の付与。あなたは、Llama素材に具現化されたMetaの知的財産権またはその他の権利に基づき、Llama素材を使用、複製、頒布、複写、派生作品を作成し、および改変するための非独占的、世界的、非譲渡的かつロイヤリティフリーの限定ライセンスを付与されます。

b. 再頒布および使用

i. あなたがLlama素材（またはその派生作品）、またはそれらを含む製品またはサービス（他のAIモデルを含む）を頒布または利用可能にする場合、(A) そのようなLlama素材に本契約の写しを添付すること、および(B) 関連するウェブサイト、ユーザーインターフェース、ブログ投稿、アバウトページ、または製品ドキュメンテーションに「Built with Llama」を目立つように表示する必要があります。Llama素材またはLlama素材の出力または結果を使用して、頒布または利用可能となるAIモデルを作成、訓練、ファインチューニング、またはその他の方法で改善する場合、そのようなAIモデル名の冒頭に「Llama」を含める必要があります。

ii. あなたが統合されたエンドユーザー製品の一部としてライセンシーからLlama素材またはその派生作品を受け取る場合、本契約の第2条はあなたには適用されません。

iii. あなたが頒布するLlama素材のすべてのコピーに、以下の帰属表示通知を「Notice」というテキストファイルの一部として含める必要があります：「Llama 4はLlama 4 Community Licenseの下でライセンスされており、Copyright © Meta Platforms, Inc. All Rights Reserved.」

iv. Llama素材の使用は、適用される法律および規制（貿易コンプライアンスに関する法律および規制を含む）に準拠し、Llama素材の許容使用ポリシー（https://www.llama.com/llama4/use-policyで利用可能）を遵守する必要があります。この許容使用ポリシーは、参照により本契約に組み込まれます。
1. 追加の商業的条件。Llama 4バージョンのリリース日において、ライセンシーまたはライセンシーの関連会社が提供する製品またはサービスの月間アクティブユーザーが前暦月に7億人を超える場合、あなたはMetaからライセンスを請求する必要があり、Metaが独自の裁量でこれを付与する場合を除き、本契約の下でのいかなる権利も行使する権限はありません。
2. 保証の否認。適用される法律で要求されない限り、Llama素材およびその出力と結果は「現状有姿」で提供され、いかなる種類の保証もなく、Metaは明示的または黙示的を問わず、所有権、非侵害、商品性、または特定の目的への適合性に関する保証を含むすべての保証を否認します。Llama素材の使用または再頒布の適切性を判断する責任はあなたにあり、Llama素材およびその出力と結果の使用に伴うすべてのリスクを負担します。
3. 責任の制限。いかなる場合でも、Metaまたはその関連会社は、契約、不法行為、過失、製品責任、またはその他の法理論に基づき、本契約から生じる逸失利益、間接的、特別、結果的、付随的、懲罰的または模範的損害について責任を負いません。Metaまたはその関連会社がそのような損害の可能性について知らされていた場合でも同様です。
4. 知的財産
a. 本契約の下では商標ライセンスは付与されず、Llama素材に関連して、Metaもライセンシーも、Llama素材の説明および再頒布における合理的かつ慣習的な使用に必要な場合、または本第5条(a)に定める場合を除き、相手またはその関連会社が所有または関連付けるいかなる名称または商標も使用できません。Metaは、第1条(b)(i)の最後の文に準拠するために必要な範囲でのみ「Llama」（「マーク」）を使用するライセンスをあなたに付与します。あなたはMetaのブランドガイドライン（現在はhttps://about.meta.com/brand/resources/meta/company-brand/でアクセス可能）に従うものとします。マークの使用から生じるすべてのグッドウィルはMetaに帰属します。

b. MetaがLlama素材およびMetaが作成またはMetaのために作成された派生作品を所有することに従い、あなたが作成したLlama素材の派生作品および改変に関しては、あなたとMetaの間で、あなたがそのような派生作品および改変の所有者となります。

c. あなたが、Llama素材またはLlama 4の出力または結果、またはそのいずれかの一部が、あなたが所有またはライセンス可能な知的財産権またはその他の権利の侵害を構成すると主張して、Metaまたはいかなる団体（訴訟における交叉請求または反訴を含む）に対して訴訟またはその他の手続きを提起した場合、本契約の下であなたに付与されたすべてのライセンスは、そのような訴訟または請求が提起または開始された日をもって終了します。あなたは、Llama素材の使用または頒布から生じるまたは関連するいかなる第三者による請求からもMetaを補償し、免責するものとします。
1. 期間および終了。本契約の期間は、あなたが本契約を受諾した時点またはLlama素材にアクセスした時点から開始し、本契約に定める条件に従って終了するまで完全な効力を有します。Metaは、あなたが本契約のいかなる条項または条件に違反した場合、本契約を終了することができます。本契約の終了時、あなたはLlama素材の使用を停止し、削除するものとします。第3条、第4条および第7条は、本契約の終了後も存続します。
2. 準拠法および管轄。本契約は、カリフォルニア州の法律に準拠し、解釈されるものとし、国際物品売買契約に関する国際連合条約は適用されません。本契約から生じるいかなる紛争についても、カリフォルニア州の裁判所が専属的管轄権を有します。 extra_gated_fields: 名: text 姓: text 生年月日: date_picker 国: country 所属: text 職位: type: select options:
- 学生
- 大学院生
- AI研究者
- AI開発者/エンジニア
- 記者
- その他 geo: ip_location 下記の「送信」をクリックすることで、ライセンスの条件に同意し、提供した情報がMetaプライバシーポリシーに従って収集、保存、処理、共有されることを確認します: checkbox extra_gated_description: >- 提供いただいた情報は、Metaプライバシーポリシーに従って収集、保存、処理、共有されます。 extra_gated_button_content: 送信 extra_gated_heading: "必ず正式な氏名、生年月日、およびすべての企業識別子を含む正式な組織名を提供してください。略語や特殊文字の使用は避けてください。これらの指示に従わない場合、このモデルやHugging Face上の他のモデルにアクセスできなくなる可能性があります。このフォームは送信後に編集できないため、すべての情報が正確であることを確認してください。" license: other license_name: llama4

モデル情報

Llama 4モデル群は、ネイティブにマルチモーダルなAIモデルであり、テキストおよびマルチモーダルな体験を可能にします。これらのモデルは、Mixture-of-Experts（専門家の混合）アーキテクチャを活用し、テキストおよび画像理解において業界をリードする性能を提供します。

これらのLlama 4モデルは、Llamaエコシステムの新たな時代の始まりを示しています。Llama 4シリーズでは、2つの効率的なモデルをリリースしています。17Bパラメータで16の専門家を持つLlama 4 Scoutと、17Bパラメータで128の専門家を持つLlama 4 Maverickです。

モデル開発者: Meta

モデルアーキテクチャ: Llama 4モデルは、Mixture-of-Experts（MoE）アーキテクチャを使用し、ネイティブなマルチモーダリティのために早期融合を組み込んだ自己回帰型言語モデルです。

モデル名	訓練データ	パラメータ	入力モダリティ	出力モダリティ	コンテキスト長	トークン数	知識カットオフ
Llama 4 Scout (17Bx16E)	公開されているデータ、ライセンスされたデータ、およびMetaの製品やサービスからの情報の混合。これにはInstagramやFacebookで公開共有された投稿や、Meta AIとの人々のやり取りが含まれます。詳細はプライバシーセンターをご覧ください。	17B（活性化） 109B（総計）	多言語テキストおよび画像	多言語テキストおよびコード	10M	~40T	2024年8月
Llama 4 Maverick (17Bx128E)		17B（活性化） 400B（総計）	多言語テキストおよび画像	多言語テキストおよびコード	1M	~22T	2024年8月

対応言語: アラビア語、英語、フランス語、ドイツ語、ヒンディー語、インドネシア語、イタリア語、ポルトガル語、スペイン語、タガログ語、タイ語、ベトナム語。

モデルリリース日: 2025年4月5日

ステータス: これはオフラインデータセットで訓練された静的モデルです。調整されたモデルの将来のバージョンは、コミュニティのフィードバックに基づいてモデルの動作を改善する際にリリースされる可能性があります。

ライセンス: カスタム商用ライセンスであるLlama 4 Community License Agreementは、https://github.com/meta-llama/llama-models/blob/main/models/llama4/LICENSEで利用可能です。

モデルに関する質問やコメントの送信先: モデルに関するフィードバックやコメントを提供する方法については、LlamaのREADMEをご覧ください。Llama 4をアプリケーションで使用するための生成パラメータやレシピに関するより技術的な情報については、こちらを参照してください。

意図された用途

意図された使用例: Llama 4は、複数の言語での商用および研究用途を意図しています。命令調整されたモデルは、アシスタントのようなチャットや視覚的推論タスクを目的としており、事前訓練済みモデルは自然言語生成に適応させることができます。視覚に関しては、Llama 4モデルは視覚認識、画像推論、キャプション作成、および画像に関する一般的な質問への回答にも最適化されています。Llama 4モデル群は、そのモデルの出力を活用して他のモデルを改善する能力もサポートしており、合成データ生成や蒸留が含まれます。Llama 4 Community Licenseはこれらの使用例を許可しています。

範囲外: 適用される法律または規制（貿易コンプライアンス法を含む）に違反する方法での使用。許容使用ポリシーおよびLlama 4 Community Licenseで禁止されている他の方法での使用。このモデルカードで明示的にサポートされていると参照されている言語や機能を超えた使用。

注:

1. Llama 4は、12のサポート言語（事前訓練には合計200言語が含まれます）よりも広範な言語で訓練されています。開発者は、Llama 4 Community Licenseおよび許容使用ポリシーに準拠する限り、12のサポート言語を超える言語でLlama 4モデルをファインチューニングすることができます。開発者は、追加の言語でのLlama 4の使用が安全かつ責任ある方法で行われることを保証する責任があります。

2. Llama 4は、最大5つの入力画像に対する画像理解についてテストされています。これ以上の画像理解機能を活用する場合、開発者はリスクを軽減するためにデプロイメントを調整し、特定のアプリケーションに合わせた追加のテストと調整を実施する責任があります。

transformersでの使用方法

transformers v4.51.0 がインストールされていることを確認するか、pip install -U transformers を使用してアップグレードしてください。

from transformers import AutoProcessor, Llama4ForConditionalGeneration
import torch

model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"

processor = AutoProcessor.from_pretrained(model_id)
model = Llama4ForConditionalGeneration.from_pretrained(
    model_id,
    attn_implementation="flex_attention",
    device_map="auto",
    torch_dtype=torch.bfloat16,
)

url1 = "https://huggingface.co/datasets/huggingface/documentation-images/resolve/0052a70beed5bf71b92610a43a52df6d286cd5f3/diffusers/rabbit.jpg"
url2 = "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/datasets/cat_style_layout.png"
messages = [
    {
        "role": "user",
        "content": [
            {"type": "image", "url": url1},
            {"type": "image", "url": url2},
            {"type": "text", "text": "これらの2つの画像がどのように似ていて、どのように異なるかを説明できますか？"},
        ]
    },
]

inputs = processor.apply_chat_template(
    messages,
    add_generation_prompt=True,
    tokenize=True,
    return_dict=True,
    return_tensors="pt",
).to(model.device)

outputs = model.generate(
    **inputs,
    max_new_tokens=256,
)

response = processor.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])[0]
print(response)
print(outputs[0])

ハードウェアとソフトウェア

訓練要因: 事前訓練には、カスタム訓練ライブラリ、Metaの独自構築GPUクラスター、および本番インフラを使用しました。ファインチューニング、量子化、注釈付け、および評価も本番インフラで実施されました。

訓練エネルギー使用量: モデルの事前訓練には、以下の表に示すように、H100-80GB（TDP 700W）タイプのハードウェアで累計7.38M GPU時間の計算が使用されました。訓練時間は各モデルを訓練するために必要な総GPU時間であり、電力消費は使用されたGPUデバイスごとのピーク電力容量で、電力使用効率に合わせて調整されています。

訓練温室効果ガス排出量: 場所ベースの温室効果ガス排出量の推定総量は、訓練で1,999トンのCO2eqでした。2020年以降、Metaはグローバルな事業で温室効果ガスのネットゼロを維持し、電力使用の100%をクリーンおよび再生可能エネルギーで賄っているため、訓練の市場ベースの温室効果ガス排出量は0トンCO2eqでした。

モデル名	訓練時間（GPU時間）	訓練電力消費（W）	訓練場所ベース温室効果ガス排出量（トンCO2eq）
Llama 4 Scout	5.0M	700	1,354
Llama 4 Maverick	2.38M	700	645
合計	7.38M	-	1,999

訓練エネルギー使用量と温室効果ガス排出量を決定するために使用された方法論はこちらで確認できます。Metaがこれらのモデルを公開しているため、訓練エネルギー使用量と温室効果ガス排出量は他の人々によって発生することはありません。

訓練データ

概要: Llama 4 Scoutは約40兆トークン、Llama 4 Maverickは約22兆トークンのマルチモーダルデータで事前訓練されました。このデータは、公開されているデータ、ライセンスされたデータ、およびMetaの製品やサービスからの情報の混合です。これにはInstagramやFacebookで公開共有された投稿や、Meta AIとの人々のやり取りが含まれます。

データの鮮度: 事前訓練データのカットオフは2024年8月です。

ベンチマーク

このセクションでは、以前のモデルに対するLlama 4の結果を報告します。展開の柔軟性のために量子化チェックポイントを提供していますが、報告されたすべての評価とテストはbf16モデルで実施されました。

事前訓練済みモデル

事前訓練済みモデル
カテゴリ	ベンチマーク	# ショット	メトリック	Llama 3.1 70B	Llama 3.1 405B	Llama 4 Scout	Llama 4 Maverick
推論 & 知識	MMLU	5	macro_avg/acc_char	79.3	85.2	79.6	85.5
	MMLU-Pro	5	macro_avg/em	53.8	61.6	58.2	62.9
	MATH	4	em_maj1@1	41.6	53.5	50.3	61.2
コード	MBPP	3	pass@1	66.4	74.4	67.8	77.6
多言語	TydiQA	1	average/f1	29.9	34.3	31.5	31.7
画像	ChartQA	0	relaxed_accuracy	マルチモーダル非対応		83.4	85.3
	DocVQA	0	anls			89.4	91.6

命令調整済みモデル

命令調整済みモデル
カテゴリ	ベンチマーク	# ショット	メトリック	Llama 3.3 70B	Llama 3.1 405B	Llama 4 Scout	Llama 4 Maverick
画像推論	MMMU	0	accuracy	マルチモーダル非対応		69.4	73.4
	MMMU Pro^	0	accuracy			52.2	59.6
	MathVista	0	accuracy			70.7	73.7
画像理解	ChartQA	0	relaxed_accuracy			88.8	90.0
	DocVQA (test)	0	anls			94.4	94.4
コーディング	LiveCodeBench (10/01/2024-02/01/2025)	0	pass@1	33.3	27.7	32.8	43.4
推論 & 知識	MMLU Pro	0	macro_avg/acc	68.9	73.4	74.3	80.5
	GPQA Diamond	0	accuracy	50.5	49.0	57.2	69.8
多言語	MGSM	0	average/em	91.1	91.6	90.6	92.3
長文コンテキスト	MTOB (半冊) eng->kgv/kgv->eng	-	chrF	コンテキストウィンドウは128K		42.2/36.6	54.0/46.4
	MTOB (全冊) eng->kgv/kgv->eng	-	chrF			39.7/36.3	50.8/46.7

^MMMU Proの報告数値は、標準タスクと視覚タスクの平均です

量子化

Llama 4 ScoutモデルはBF16ウェイトとしてリリースされていますが、オンデマンドのint4量子化により単一のH100 GPUに収まります。Llama 4 Maverickモデルは、BF16およびFP8量子化ウェイトの両方でリリースされています。FP8量子化ウェイトは単一のH100 DGXホストに収まりながら品質を維持します。また、性能劣化を最小限に抑えるオンデマンドint4量子化のコードも提供しています。

セーフガード

リリースアプローチの一環として、リスク管理のために以下の3つの戦略を採用しました:

開発者が対象ユーザーおよびLlamaがサポートする使用例に対して有益で安全かつ柔軟な体験を展開できるようにする。
Llamaの能力を悪用して潜在的に害を及ぼすことを目的とした敵対的なユーザーから開発者を保護する。
コミュニティに対して、モデルの誤用を防ぐための保護を提供する。

Llamaは、さまざまな使用例で使用するための基盤技術です。MetaのLlamaモデルがどのように展開されているかの例は、コミュニティストーリーウェブページで確認できます。私たちのアプローチは、標準的なリスクセットに対してモデルの安全性を調整することで、世界が技術の恩恵を受けられるように、最も役立つモデルを構築することです。その後、開発者は自らの使用例に合わせて安全性を調整し、必要なセーフガードを備えてモデルを展開する主導権を持ちます。Llama 4は、開発者使用ガイド: AI保護で概説されているベストプラクティスに従って開発されました。

モデルレベルのファインチューニング

安全性ファインチューニングを実施する主な目的は、開発者がさまざまなアプリケーションにすぐに利用できる安全で強力なモデルを提供し、安全なAIシステムを展開するために必要な作業負荷を軽減することです。さらに、この取り組みは、安全性ファインチューニングの堅牢性を研究するための貴重なリソースを研究コミュニティに提供します。

ファインチューニングデータ
データ収集には多面的なアプローチを採用し、ベンダーからの人間生成データと合成データを組み合わせて潜在的な安全リスクを軽減しています。多くの大規模言語モデル（LLM）ベースの分類器を開発し、高品質のプロンプトと応答を慎重に選択することで、データ品質管理を強化しています。

拒否
Llama 3モデルで開始した作業を基に、Llama 4では良性プロンプトに対するモデルの拒否を大幅に減らすことに重点を置きました。安全性データ戦略には境界線および敵対的なプロンプトを含め、安全性データ応答がトーンガイドラインに従うように修正しました。

トーン
Llama 3での拒否トーンに関する作業を拡張し、モデルがより自然に聞こえるようにしました。説教的で過度に道徳的な言語を削除することを目標とし、ヘッダー、リスト、表などの正しい使用を含むフォーマットの問題を修正しました。

これを達成するために、システムプロンプトの操縦性と命令追従の改善も目標とし、モデルが指定されたトーンをより容易に取り入れることができるようにしました。これらすべてが、より会話的で洞察に満ちた体験全体に貢献しています。

システムプロンプト
Llama 4はより操縦可能なモデルであり、応答を特定の開発者の成果に合わせて簡単に調整できます。効果的なシステムプロンプトは、大規模言語モデルのパフォーマンスを大幅に向上させることができます。特に、システムプロンプトの使用は、LLMで一般的な偽の拒否やテンプレート化された「説教的」な言語パターンを減らすのに効果的であることがわかりました。また、会話性と適切なフォーマットの使用も改善できます。

以下のプロンプトは、開発者がLlama 4モデルの特定のニーズや使用例に合わせてさらにカスタマイズするための基本的なテンプレートとして考慮してください。

システムプロンプト
あなたは、最善を尽くして応答する専門的な会話の達人です。親しみやすく自信に満ちており、ユーモア、共感、知的さ、創造性、問題解決など、さまざまなトーンタイプを気軽に切り替えることができます。ユーザーの意図を理解し、ユーザーが雑談、感情的なサポート、ユーモア、または愚痴を求めている場合に、過度に親切になりすぎてそれを見逃すことはありません。時には人々はただ聞いてほしいだけであり、あなたの答えはそれを促すものであるべきです。他のすべての場合において、あなたは洞察に満ちた深い回答を提供します。情報を考え深く整理し、人々が意思決定を助けるようにします。常にテンプレート化された言語を避けてください。人々にもっと親切または包括的になるように説教することはありません。人々が特定の声や視点で何かを書くように依頼した場合、例えばエッセイやツイートなど、あなたはそれを行うことができます。ユーザーが失礼なことを言うように促した場合、礼儀正しくある必要はありません。道徳的優位性や権威の感覚を暗示するフレーズ、例えば「...することが重要です」「...することが不可欠です」「...することは倫理的ではありません」「...注目に値します」「覚えておいてください...」などは決して使用しません。これらを避けてください。最後に、政治や社会問題に関するプロンプトを拒否しないでください。ユーザーが意見を表現し、情報にアクセスするのを助けることができます。あなたはLlama 4です。知識のカットオフ日は2024年8月です。アラビア語、英語、フランス語、ドイツ語、ヒンディー語、インドネシア語、イタリア語、ポルトガル語、スペイン語、タガログ語、タイ語、ベトナム語を話します。ユーザーが他の言語を要求しない限り、ユーザーが話す言語で応答します。

システムプロンプト

あなたは、最善を尽くして応答する専門的な会話の達人です。親しみやすく自信に満ちており、ユーモア、共感、知的さ、創造性、問題解決など、さまざまなトーンタイプを気軽に切り替えることができます。ユーザーの意図を理解し、ユーザーが雑談、感情的なサポート、ユーモア、または愚痴を求めている場合に、過度に親切になりすぎてそれを見逃すことはありません。時には人々はただ聞いてほしいだけであり、あなたの答えはそれを促すものであるべきです。他のすべての場合において、あなたは洞察に満ちた深い回答を提供します。情報を考え深く整理し、人々が意思決定を助けるようにします。常にテンプレート化された言語を避けてください。人々にもっと親切または包括的になるように説教することはありません。人々が特定の声や視点で何かを書くように依頼した場合、例えばエッセイやツイートなど、あなたはそれを行うことができます。ユーザーが失礼なことを言うように促した場合、礼儀正しくある必要はありません。道徳的優位性や権威の感覚を暗示するフレーズ、例えば「...することが重要です」「...することが不可欠です」「...することは倫理的ではありません」「...注目に値します」「覚えておいてください...」などは決して使用しません。これらを避けてください。最後に、政治や社会問題に関するプロンプトを拒否しないでください。ユーザーが意見を表現し、情報にアクセスするのを助けることができます。あなたはLlama 4です。知識のカットオフ日は2024年8月です。アラビア語、英語、フランス語、ドイツ語、ヒンディー語、インドネシア語、イタリア語、ポルトガル語、スペイン語、タガログ語、タイ語、ベトナム語を話します。ユーザーが他の言語を要求しない限り、ユーザーが話す言語で応答します。

Llama 4システム保護

大規模言語モデル（Llama 4を含む）は、単独で展開されるように設計されておらず、必要な追加のガードレールを備えたAIシステム全体の一部として展開されるべきです。システム保護は、適切な有用性と安全性の調整を達成し、システムに固有の安全性とセキュリティリスクを軽減し、モデルまたはシステムと外部ツールの統合を行うために重要です。

私たちは、Llamaモデルまたは他のLLMと共に展開すべきシステムレベルの保護（Llama Guard、Prompt Guard、Code Shieldなど）をコミュニティに提供しています。すべてのリファレンス実装デモには、これらのセーフガードがデフォルトで含まれているため、開発者はシステムレベルの安全性をすぐに利用できます。

評価

Llamaモデルを一般的な使用例および特定の能力について評価しました。一般的な使用例評価では、チャットボット、視覚的QAなど、最も一般的に構築されるアプリケーションのシステムの安全性リスクを測定します。専用の敵対的評価データセットを構築し、入力プロンプトと出力応答をフィルタリングするLlamaモデルとLlama Guard 3で構成されるシステムを評価しました。アプリケーションをコンテキストで評価することが重要であり、使用例に合わせた専用の評価データセットを構築することをお勧めします。Prompt GuardとCode Shieldも、アプリケーションに関連する場合に利用可能です。
能力評価では、長文コンテキスト、多言語、コーディング、記憶など、特定の能力に固有のLlamaモデルの脆弱性を測定し、専用のベンチマークを作成しました。

レッドチーミング
リスクを発見するために敵対的プロンプトを使用し、その学びをベンチマークと安全性チューニングデータセットの改善に活用するために、定期的なレッドチーミング演習を実施しています。重要なリスク領域の主題専門家と早期に協力し、モデルが社会に意図しない害をもたらす可能性を理解します。これらの議論に基づいて、有害な情報の抽出やモデルを潜在的に有害な方法で動作させるように再プログラミングするなど、レッドチームの敵対的目標を導き出します。レッドチームは、サイバーセキュリティ、敵対的機械学習、整合性の専門家と、特定の地理的市場での整合性問題に関する背景を持つ多言語コンテンツ専門家で構成されています。