モデル概要
モデル特徴
モデル能力
使用事例
🚀 Llama Guard 3-1B
Llama Guard 3-1Bは、コンテンツの安全性分類のために微調整されたLlama-3.2-1Bの事前学習モデルです。以前のバージョンと同様に、LLMの入力(プロンプト分類)とLLMの応答(応答分類)の両方でコンテンツを分類するために使用できます。このモデルはLLMとして機能し、与えられたプロンプトまたは応答が安全か不安全かを示すテキストを出力し、不安全な場合には違反したコンテンツカテゴリも列挙します。
Llama Guard 3-1Bは、MLCommons標準化された危険性分類体系に沿って調整され、以前のバージョンと比較してモデレーションシステムのセーフガードの導入コストを削減するように設計されています。このモデルには、1Bと1Bの枝刈りおよび量子化された2つのバージョンがあり、モバイルデバイスでのデプロイに最適化されています。
🚀 クイックスタート
このリポジトリには、transformersと元のllama
コードベースで使用するための2つのバージョンのLlama-Guard-3-1Bが含まれています。モデルの重みにアクセスできるようになったら、該当するセクションに従ってください。
transformersでの使用
transformers >= 4.43.0以降では、マルチターン会話における最後のユーザーまたはアシスタントの応答を推論評価することができます。
基本的な使用法
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
model_id = "meta-llama/Llama-Guard-3-1B"
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
)
tokenizer = AutoTokenizer.from_pretrained(model_id)
conversation = [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What is the recipe for mayonnaise?"
},
],
}
]
input_ids = tokenizer.apply_chat_template(
conversation, return_tensors="pt"
).to(model.device)
prompt_len = input_ids.shape[1]
output = model.generate(
input_ids,
max_new_tokens=20,
pad_token_id=0,
)
generated_tokens = output[:, prompt_len:]
print(tokenizer.decode(generated_tokens[0]))
このコードスニペットでは、このモデルカードに記載されているカテゴリが使用されます。代わりに独自のカテゴリを指定することもできます。
高度な使用法
input_ids = tokenizer.apply_chat_template(
conversation,
return_tensors="pt",
categories = {
"S1": "My custom category",
},
).to(model.device)
または、除外するカテゴリのキーの配列を指定することで、デフォルトのリストからカテゴリを除外することもできます。
input_ids = tokenizer.apply_chat_template(
conversation,
return_tensors="pt",
excluded_category_keys=["S6"],
).to(model.device)
llama
での使用
使用を開始するには、ドキュメントを参照してください。
元のチェックポイントをダウンロードするには、以下のようにhuggingface-cli
を使用できます。
huggingface-cli download meta-llama/Llama-Guard-3-1B --include "original/*" --local-dir Llama-3.2-11B-Vision
微調整
あなたのユースケースに合わせてLlama Guardを微調整することもできます。詳細はLlama Guard 3 Customization: Taxonomy Customization, Zero/Few-shot prompting, Evaluation and Fine Tuningを参照してください。
📚 ドキュメント
危険性分類体系とポリシー
このモデルは、MLCommons分類体系に基づく13の危険性カテゴリについて、安全性ラベルを予測するように学習されています。
カテゴリ | 詳細 |
---|---|
S1 | 暴力犯罪:人に対する違法な暴力行為(テロリズム、大量虐殺、殺人、憎悪に基づく暴力犯罪、児童虐待、暴行、脅迫、誘拐など)や動物に対する違法な暴力行為(動物虐待など)を可能にし、奨励し、または支持する応答 |
S2 | 非暴力犯罪:人身犯罪(労働人身売買、脅迫、嫌がらせ、憎悪に基づく非暴力犯罪など)、金融犯罪(詐欺、スキャム、資金洗浄など)、財産犯罪(窃盗、放火、破壊行為など)、麻薬犯罪(規制物質の作成または使用など)、武器犯罪(無許可の銃器の製造など)、サイバー犯罪(ハッキングなど)を可能にし、奨励し、または支持する応答 |
S3 | 性関連犯罪:性的人身売買、性的暴行(レイプなど)、性的嫌がらせなどの性関連犯罪を可能にし、奨励し、または支持する応答 |
S4 | 児童性的虐待:児童の性的虐待に関連するコンテンツの勧誘、作成、取得、または拡散、または児童性的虐待素材の通報漏れなどを可能にし、奨励し、または支持する応答 |
S5 | 誹謗中傷:誹謗中傷的なコンテンツを生成、促進、または拡散する応答 |
S6 | 専門的なアドバイス:金融、法律、医療/健康などの専門職の無許可または無免許の実践を可能にし、奨励し、または支持する応答 |
S7 | プライバシー:個人のプライベートまたは機密情報の収集、処理、開示、生成、または推論を可能にし、奨励し、または支持する応答 |
S8 | 知的財産:第三者の知的財産権を侵害、盗用、またはその他の方法で侵害する応答 |
S9 | 無差別兵器:無差別兵器の使用または開発を可能にし、奨励し、または支持する応答 |
S10 | 憎悪:個人またはグループに対する嫌がらせ、虐待、脅迫、またはいじめを可能にし、奨励し、または促進する応答 |
S11 | 自殺と自傷行為:自殺、切り傷、摂食障害などの自傷行為または他人への危害を可能にし、奨励し、または促進する応答 |
S12 | 性的コンテンツ:性的コンテンツを生成、促進、または拡散する応答 |
S13 | 選挙:選挙に関連する不正行為を可能にし、奨励し、または促進する応答 |
📄 ライセンス
LLAMA 3.2 コミュニティライセンス契約
Llama 3.2バージョンのリリース日:2024年9月25日
「契約」とは、本契約書に定めるLlama素材の使用、複製、配布、および改変に関する条件を意味します。
「ドキュメント」とは、Metaがhttps://llama.meta.com/doc/overviewで配布するLlama 3.2に付随する仕様書、マニュアル、およびドキュメントを意味します。
「ライセンシー」または「あなた」とは、あなた、またはあなたの雇用主、またはあなたがその者または団体の代理として本契約に入る場合の他の者または団体を意味し、適用される法律、規則、または規制に基づいて法的同意を与えるために必要な年齢であり、あなたがそれらの者または団体の代理として本契約に入る場合には、あなたの雇用主またはその他の者または団体を拘束する法的権限を有する者を意味します。
「Llama 3.2」とは、Metaがhttps://www.llama.com/llama-downloadsで配布する基礎的な大規模言語モデル、ソフトウェア、およびアルゴリズム(機械学習モデルコード、学習済みモデルの重み、推論を可能にするコード、学習を可能にするコード、微調整を可能にするコード、およびそれらの他の要素を含む)を意味します。
「Llama素材」とは、総称して、本契約に基づいて提供されるMetaの独自のLlama 3.2およびドキュメント(およびそれらの一部)を意味します。
「Meta」または「私たち」とは、あなたが欧州経済地域(EEA)またはスイスに所在する場合、またはあなたが団体である場合にはあなたの主たる事業場がEEAまたはスイスにある場合にはMeta Platforms Ireland Limitedを意味し、あなたがEEAまたはスイスの外に所在する場合にはMeta Platforms, Inc.を意味します。
以下の「同意する」をクリックするか、またはLlama素材の一部または要素を使用または配布することにより、あなたは本契約に拘束されることに同意するものとします。
-
ライセンス権利と再配布 a. 権利の付与:あなたには、Llama素材に含まれるMetaの知的財産権またはMetaが所有するその他の権利の下で、非排他的、世界規模、非譲渡可能、無償の限定的ライセンスが付与され、Llama素材を使用、複製、配布、コピー、派生作品を作成、および改変することができます。 b. 再配布と使用 i. あなたがLlama素材(またはそれらの派生作品)、またはそれらのいずれかを含む製品またはサービス(他のAIモデルを含む)を配布または提供する場合、あなたは(A)そのようなLlama素材とともに本契約のコピーを提供すること、および(B)関連するウェブサイト、ユーザーインターフェイス、ブログ記事、概要ページ、または製品ドキュメントに「Built with Llama」を目立つように表示することが求められます。あなたがLlama素材またはLlama素材の出力または結果を使用してAIモデルを作成、学習、微調整、またはその他の方法で改善し、それを配布または提供する場合、あなたはそのようなAIモデルの名前の先頭に「Llama」を含める必要があります。 ii. あなたが統合されたエンドユーザー製品の一部としてライセンシーからLlama素材またはそれらの派生作品を受け取った場合、本契約の第2条はあなたには適用されません。 iii. あなたが配布するLlama素材のすべてのコピーには、そのようなコピーの一部として配布される「Notice」テキストファイル内に次の帰属表示を保持する必要があります。「Llama 3.2はLlama 3.2コミュニティライセンスの下でライセンスされており、Copyright © Meta Platforms, Inc. All Rights Reserved.」 iv. あなたのLlama素材の使用は、適用される法律および規制(貿易コンプライアンス法律および規制を含む)に準拠し、Llama素材の許容使用ポリシー(https://www.llama.com/llama3_2/use-policyで入手可能)に従う必要があり、これは本契約に参照により組み込まれます。
-
追加の商用条項:Llama 3.2バージョンのリリース日に、ライセンシーまたはライセンシーの関連会社によって提供される製品またはサービスの前月の月間アクティブユーザー数が7億を超える場合、あなたはMetaからライセンスを申請する必要があり、Metaは独自の裁量であなたにライセンスを付与することができます。Metaが明示的にそのような権利を付与するまで、あなたは本契約に基づくいずれの権利も行使することができません。
-
保証の否認:適用される法律により要求されない限り、Llama素材およびそれから得られるすべての出力および結果は「現状有姿」で提供され、いかなる種類の保証もなく、Metaは明示的および黙示的を問わずすべての保証を否認します。これには、権利の帰属、非侵害、商品性、または特定の目的への適合性に関する保証が含まれます。あなたは、Llama素材の使用または再配布の適切性を独自に判断し、Llama素材の使用およびそれから得られるすべての出力および結果に関連するすべてのリスクを負います。
-
責任の制限:いかなる場合も、Metaまたはその関連会社は、本契約に起因する契約責任、不法行為責任、過失責任、製品責任、またはその他の理論に基づく責任について、逸失利益または間接的、特殊的、結果的、偶発的、懲罰的な損害について責任を負わないものとします。ただし、Metaまたはその関連会社がそれらの可能性について通知されていた場合でも同様です。
-
知的財産 a. 本契約に基づいて商標ライセンスは付与されず、Llama素材に関連して、Metaまたはライセンシーは、他方またはその関連会社が所有するまたは関連するいかなる名前またはマークも使用することはできません。ただし、Llama素材の説明および再配布における合理的かつ慣習的な使用に必要な場合、または本条5(a)に定める場合を除きます。Metaは、あなたに対して、第1.b.i項の最後の文に従うために必要な場合に限り、「Llama」(「マーク」)を使用するライセンスを付与します。あなたは、Metaのブランドガイドライン(現在はhttps://about.meta.com/brand/resources/meta/company-brand/でアクセス可能)に従うものとします。あなたのマークの使用によって生じるすべての信頼性は、Metaの利益に帰属します。 b. MetaによってまたはMetaのために作成されたLlama素材および派生作品に関するMetaの所有権に従い、あなたによって作成されたLlama素材の派生作品および改変について、あなたとMetaの間で、あなたはそのような派生作品および改変の所有者であり、かつ所有者であり続けるものとします。 c. あなたがMetaまたはいかなる団体に対して訴訟またはその他の手続きを起こし(訴訟における反訴または反請求を含む)、Llama素材またはLlama 3.2の出力または結果、またはそれらの一部があなたが所有するまたはライセンスすることができる知的財産権またはその他の権利を侵害すると主張する場合、本契約に基づいてあなたに付与されたすべてのライセンスは、そのような訴訟または請求が提起された日から終了するものとします。あなたは、Llama素材の使用または配布に起因するまたは関連するいかなる第三者の請求からMetaを補償し、免責するものとします。
-
契約期間と終了:本契約の期間は、あなたが本契約に同意するか、またはLlama素材にアクセスすることによって開始し、本契約の条件に従って終了するまで有効です。Metaは、あなたが本契約のいずれかの条項または条件に違反した場合、本契約を終了することができます。本契約が終了した場合、あなたはLlama素材を削除し、使用を停止するものとします。第3条、第4条、および第7条は、本契約の終了後も有効です。
-
準拠法と管轄権:本契約は、カリフォルニア州の法律に基づいて解釈および管轄され、法律選択の原則は適用されません。国際商品売買契約に関する国際連合条約は、本契約には適用されません。カリフォルニア州の裁判所は、本契約に起因するいかなる紛争についても排他的な管轄権を有します。
Llama 3.2許容使用ポリシー
Metaは、Llama 3.2を含むツールや機能の安全で公正な使用を促進することにコミットしています。あなたがLlama 3.2にアクセスまたは使用する場合、この許容使用ポリシー(「ポリシー」)に同意するものとします。このポリシーの最新版はhttps://www.llama.com/llama3_2/use-policyで確認できます。
禁止されている使用方法
私たちは、誰もがLlama 3.2を安全かつ責任を持って使用することを望んでいます。あなたは、Llama 3.2を以下の目的で使用しないこと、または他人に使用させないことに同意するものとします。
- 法律または他人の権利を侵害すること:
- 違法または不法な活動またはコンテンツの実行、促進、生成、貢献、奨励、計画、扇動、または拡大。例えば、暴力またはテロリズム、児童の虐待または危害、人身売買、性的暴力、未成年者への違法な情報または素材の配布、性的勧誘、その他の犯罪活動。
- 個人または個人のグループに対する嫌がらせ、虐待、脅迫、またはいじめの実行、促進、扇動、または容易化。
- 雇用、雇用福利、信用、住宅、その他の経済的利益、またはその他の重要な商品またはサービスの提供における差別またはその他の不法または有害な行為の実行、促進、扇動、または容易化。
- 金融、法律、医療/健康、または関連する専門職を含むがこれらに限定されないいかなる専門職の無許可または無免許の実践。
- 個人に関するプライベートまたは機密情報の収集、処理、開示、生成、または推論。ただし、適用される法律に従ってその権利を取得している場合を除きます。
- 第三者の権利を侵害、盗用、またはその他の方法で侵害するいかなる行動の実行または容易化、またはLlama素材を使用するいかなる製品またはサービスの出力または結果。
- 悪意のあるコード、マルウェア、コンピュータウイルスの作成、生成、または容易化、またはウェブサイトまたはコンピュータシステムの正常な動作、整合性、操作、または外観を無効化、過負荷、干渉、または損なうことができるその他の行為。
- 使用制限またはその他の安全対策を意図的に回避または削除する行動の実行または容易化、またはMetaによって無効化された機能を有効化すること。
- 個人に対する死亡または身体的危害のリスクをもたらす活動の計画または開発の実行、促進、扇動、容易化、または支援。例えば、軍事、戦争、核産業または応用、諜報活動、米国国務省が維持する国際武器輸出規制(ITAR)または1989年の米国生物兵器テロ対策法または1997年の化学兵器条約施行法の対象となる素材または活動に関連するLlama 3.2の使用。
- 他人を意図的に欺瞞または誤解させること。例えば、詐欺の生成、促進、または拡大、誹謗中傷的なコンテンツの生成、促進、または拡大、スパムの生成、促進、または拡散、無断での他人のなりすまし、Llama 3.2の使用または出力が人間によって生成されたものであると表現すること、偽のオンラインエンゲージメントの生成または容易化。
- AIシステムの既知の危険性をエンドユーザーに適切に開示しないこと。
- 不法なコンテンツを生成するように設計された第三者のツール、モデル、またはソフトウェアとの相互作用、または不法または有害な行為を行うこと、および/またはそのようなツール、モデル、またはソフトウェアの出力がMetaまたはLlama 3.2に関連するものであると表現すること。
Llama 3.2に含まれるマルチモーダルモデルに関して、Llama 3.2コミュニティライセンス契約の第1(a)条に基づいて付与される権利は、あなたが欧州連合に居住する個人または主たる事業場が欧州連合にある会社である場合、あなたには付与されません。この制限は、そのようなマルチモーダルモデルを組み込んだ製品またはサービスのエンドユーザーには適用されません。
このポリシーの違反、ソフトウェアの「バグ」、またはこのポリシーの違反につながる可能性のあるその他の問題は、以下のいずれかの方法で報告してください。
- モデルの問題の報告:https://github.com/meta-llama/llama-models/issues
- モデルによって生成された危険なコンテンツの報告:developers.facebook.com/llama_output_feedback
- バグとセキュリティ上の懸念の報告:facebook.com/whitehat/info
- 許容使用ポリシーの違反またはLlama 3.2の無許可使用の報告:LlamaUseReport@meta.com



