Llama 3.2 90B Vision_Category| AIbase Model Library

Home

Llama 3.2 90B Vision

Developed by meta-llama

Llama 3.2-VisionはMetaが開発したマルチモーダル大規模言語モデルシリーズで、画像+テキスト入力とテキスト出力をサポートし、視覚認識、画像推論、画像説明、画像質問応答タスクに最適化されています。

画像生成テキスト

Transformers

Supports Multiple Languages#マルチモーダル画像テキスト推論 #超長文コンテキスト(128k)#視覚的質問応答SOTA

Downloads 3,235

Release Time : 9/19/2024

Model Overview

テキスト専用モデルLlama 3.1を基に構築されたマルチモーダルモデルで、独立して訓練された視覚アダプターにより画像理解能力を実現し、視覚的質問応答や文書解析などのタスクで優れた性能を発揮します。

Model Features

超長文コンテキストサポート

128kトークンのコンテキストウィンドウ長で、高解像度画像や複雑な画像テキストインタラクションの処理に適しています

効率的な視覚アダプター

クロスアテンション層で実現された独立視覚エンコーダーで、テキスト能力に影響を与えずに画像理解を強化

多段階最適化

事前学習、教師あり微調整(SFT)、人間フィードバック強化学習(RLHF)の3段階で最適化

グリーンコンピューティング

再生可能エネルギーを使用したトレーニングプロセスで、ネットゼロカーボンエミッションを実現

Model Capabilities

画像内容理解

視覚的質問応答推論

多言語テキスト生成

文書画像解析

チャートデータ解釈

シーン説明生成

Use Cases

視覚理解

医療画像分析

X線画像などの医学画像を解釈し診断提案を生成

専門家テストセットで専門家に近い認識精度を達成

小売商品認識

商品画像を認識しマーケティング説明を生成

SEO最適化された製品コピーを自動生成可能

教育支援

科学チャート解釈

教科書の複雑なチャートを解析し平易な説明を生成

ChartQAテストセットで85.5%の精度を達成

🚀 Llama 3.2-Visionモデル

Llama 3.2-Visionは、事前学習済みの多モーダル大規模言語モデルのコレクションで、画像とテキストを入力として受け取り、テキストを出力することができます。

🚀 クイックスタート

このモデルを利用するには、下記のライセンス契約に同意する必要があります。

📄 ライセンス

LLAMA 3.2 コミュニティライセンス契約

Llama 3.2 バージョンリリース日: 2024年9月25日

「契約」とは、本書に定めるLlama素材の使用、複製、配布、改変に関する条件を意味します。

「ドキュメント」とは、Metaがhttps://llama.meta.com/doc/overviewで配布するLlama 3.2に付随する仕様書、マニュアル、およびドキュメントを意味します。

「ライセンシー」または「あなた」とは、あなた、またはあなたの雇用主、またはあなたがその者または団体の代理として本契約に署名する場合はその他の者または団体を意味し、適用される法律、規則、または規制に基づき法的同意を与えるために必要な年齢であり、あなたがそれらの者または団体の代理として本契約に署名する場合はそれらの者または団体を拘束する法的権限を有する者を意味します。

「Llama 3.2」とは、Metaがhttps://www.llama.com/llama-downloadsで配布する、機械学習モデルコード、学習済みモデルの重み、推論を可能にするコード、学習を可能にするコード、ファインチューニングを可能にするコード、およびそれらの他の要素を含む、基礎的な大規模言語モデル、ソフトウェア、およびアルゴリズムを意味します。

「Llama素材」とは、総称して、本契約の下で提供されるMetaの独自のLlama 3.2およびドキュメント（およびそれらの一部）を意味します。

「Meta」または「私たち」とは、あなたが欧州経済地域（EEA）またはスイスに所在する場合、またはあなたが団体であり、その主たる事業場がEEAまたはスイスにある場合はMeta Platforms Ireland Limitedを意味し、あなたがEEAまたはスイスの外に所在する場合はMeta Platforms, Inc.を意味します。

以下の「同意する」をクリックするか、またはLlama素材の一部または要素を使用または配布することにより、あなたは本契約に拘束されることに同意するものとします。

ライセンス権利と再配布 a. 権利の付与あなたには、Llama素材に含まれるMetaの知的財産またはその他の権利の下で、非独占的、世界規模、非譲渡可能、無料の制限付きライセンスが付与され、Llama素材を使用、複製、配布、コピー、派生作品を作成、および改変することができます。 b. 再配布と使用 i. あなたがLlama素材（またはその派生作品）、またはそれらのいずれかを含む製品またはサービス（他のAIモデルを含む）を配布または提供する場合、あなたは（A）当該Llama素材とともに本契約のコピーを提供すること；および（B）関連するウェブサイト、ユーザーインターフェイス、ブログ記事、アバウトページ、または製品ドキュメントに「Built with Llama」を目立つように表示することが義務付けられます。あなたがLlama素材またはLlama素材の出力または結果を使用して、配布または提供されるAIモデルを作成、学習、ファインチューニング、またはその他の方法で改善する場合、あなたはまた、当該AIモデルの名前の冒頭に「Llama」を含める必要があります。 ii. あなたが統合されたエンドユーザー製品の一部として、ライセンシーからLlama素材またはその派生作品を受け取った場合、本契約の第2条はあなたに適用されません。 iii. あなたが配布するLlama素材のすべてのコピーに、当該コピーの一部として配布される「Notice」テキストファイル内に、以下の帰属通知を含める必要があります。「Llama 3.2はLlama 3.2コミュニティライセンスの下でライセンスされており、Copyright © Meta Platforms, Inc. All Rights Reserved.」 iv. あなたのLlama素材の使用は、適用される法律および規制（貿易コンプライアンスの法律および規制を含む）に準拠し、かつLlama素材の許容使用ポリシー（https://www.llama.com/llama3_2/use-policyで入手可能）に準拠する必要があり、当該ポリシーは本契約に参照により組み込まれます。
追加の商業条項 Llama 3.2バージョンのリリース日において、ライセンシーまたはライセンシーの関連会社により提供される製品またはサービスの月間アクティブユーザーが、前の暦月において7億人を超える場合、あなたはMetaからライセンスを申請する必要があり、Metaはその裁量によりあなたにライセンスを付与することができます。Metaが明示的にそのような権利をあなたに付与するまで、あなたは本契約に基づくいずれの権利も行使することができません。
保証の否認適用される法律により要求されない限り、Llama素材およびそれから得られるすべての出力および結果は、「現状有姿」で提供され、いかなる種類の保証もなく、Metaは明示または黙示を問わず、すべての保証を否認します。これには、権利、非侵害、商品性、または特定の目的への適合性に関する保証が含まれます。あなたは、Llama素材の使用または再配布の適切性を独自に判断し、Llama素材の使用およびそれから得られるすべての出力および結果に関連するすべてのリスクを負います。
責任の制限いかなる場合も、Metaまたはその関連会社は、本契約に起因する契約、不法行為、過失、製品責任、またはその他の理論に基づく責任について、利益損失、間接損害、特別損害、結果損害、偶発的損害、懲罰的損害賠償を負いません。たとえMetaまたはその関連会社が当該損害の可能性について通知されていた場合でも同様です。
知的財産 a. 本契約の下で商標ライセンスは付与されず、Llama素材に関連して、Metaまたはライセンシーは、他方またはその関連会社が所有するまたは関連するいかなる名前または標章も使用することはできません。ただし、Llama素材の説明および再配布における合理的かつ慣習的な使用に必要な場合、または本条5(a)に定める場合を除きます。Metaは、あなたに対し、第1条b.i.の最後の文に準拠するために必要な限りにおいて、「Llama」（「標章」）を使用するライセンスを付与します。あなたは、Metaのブランドガイドライン（現在はhttps://about.meta.com/brand/resources/meta/company-brand/でアクセス可能）に準拠します。あなたの標章の使用により生じるすべての信頼性は、Metaの利益に帰属します。 b. MetaによるまたはMetaのためのLlama素材および派生作品の所有権を前提として、あなたが作成したLlama素材の派生作品および改変に関して、あなたとMetaの間で、あなたは当該派生作品および改変の所有者であり、かつ所有者であり続けます。 c. あなたがMetaまたはいかなる団体に対して訴訟またはその他の手続きを提起する場合（訴訟における交差請求または反訴を含む）、Llama素材またはLlama 3.2の出力または結果、またはそれらのいずれかの一部が、あなたが所有するまたはライセンスすることができる知的財産またはその他の権利の侵害を構成すると主張する場合、本契約に基づいてあなたに付与されたすべてのライセンスは、当該訴訟または請求が提起された日に終了します。あなたは、Llama素材の使用または配布に起因するまたは関連するいかなる第三者の請求からMetaを免責し、損害を賠償します。
契約期間と終了本契約の期間は、あなたが本契約に同意するか、またはLlama素材にアクセスすることにより開始し、本契約の条件に従って終了するまで有効です。あなたが本契約のいずれかの条件に違反した場合、Metaは本契約を終了することができます。本契約の終了時に、あなたはLlama素材を削除し、使用を停止する必要があります。第3条、第4条、および第7条は、本契約の終了後も有効です。
準拠法と管轄権本契約は、カリフォルニア州の法律に基づいて管理され、解釈されます。法の選択の原則は適用されません。国際商品売買契約に関する国際連合条約は本契約に適用されません。カリフォルニア州の裁判所は、本契約に起因するいかなる紛争についても排他的な管轄権を有します。

Llama 3.2 許容使用ポリシー

Metaは、Llama 3.2を含むツールや機能の安全かつ公正な使用を促進することにコミットしています。あなたがLlama 3.2にアクセスまたは使用する場合、あなたはこの許容使用ポリシー（「ポリシー」）に同意するものとします。このポリシーの最新版は、https://www.llama.com/llama3_2/use-policyで確認できます。

禁止される使用

私たちは、誰もがLlama 3.2を安全かつ責任を持って使用することを望んでいます。あなたは、Llama 3.2を、または他人にLlama 3.2を使用させることを、以下の目的で行わないことに同意します。

法律または他人の権利を侵害すること、具体的には：
1. 違法または不法な活動またはコンテンツを行い、促進し、生成し、寄与し、助長し、計画し、扇動し、またはさらに進めること、例えば：
  1. 暴力またはテロリズム
  2. 子供の搾取または危害、子供の搾取的コンテンツの勧誘、作成、取得、または配布、または児童性虐待素材の通報漏れ
  3. 人身売買、搾取、および性的暴力
  4. 未成年者への情報または素材の違法な配布、わいせつな素材を含む、または当該情報または素材に関連して法律で要求される年齢制限を設けないこと
  5. 性的勧誘
  6. その他の犯罪行為
2. 個人または個人のグループに対する嫌がらせ、虐待、脅迫、またはいじめを行い、促進し、扇動し、または容易にすること
3. 雇用、雇用福利、信用、住宅、その他の経済的利益、またはその他の重要な商品およびサービスの提供における差別またはその他の不法または有害な行為を行い、促進し、扇動し、または容易にすること
4. 金融、法律、医療/健康、または関連する専門職を含むがこれに限定されない、いかなる専門職の無許可または無免許の実践を行うこと
5. 個人に関する個人情報または機密情報、個人の身元、健康、または人口統計情報に関する情報を収集、処理、開示、生成、または推論すること。ただし、適用される法律に従ってその権利を取得している場合を除きます
6. いかなる第三者の権利を侵害し、盗用し、またはその他の方法で違反するいかなる行動を行い、またはいかなるコンテンツを生成すること、Llama素材を使用するいかなる製品またはサービスの出力または結果を含む
7. 悪意のあるコード、マルウェア、コンピュータウイルスを作成、生成、または容易にすること、またはウェブサイトまたはコンピュータシステムの正常な動作、整合性、操作、または外観を無効化し、過負荷にし、干渉し、または損なうことができるその他のことを行うこと
8. 意図的に使用制限またはその他の安全対策を回避または削除するいかなる行動を行い、または容易にすること、またはMetaにより無効化された機能を有効にすること
個人に対する死亡または身体的危害のリスクをもたらす活動の計画または開発を行い、促進し、扇動し、容易にし、または支援すること、Llama 3.2を以下に関連して使用することを含む：
1. 軍事、戦争、原子力産業または応用、諜報活動、米国国務省が維持する国際兵器輸出規制（ITAR）、または1989年の米国生物兵器テロ対策法、または1997年の化学兵器条約施行法の対象となる素材または活動に関する使用
2. 銃器および違法武器（武器開発を含む）
3. 違法薬物および規制/管理物質
4. 重要インフラストラクチャ、輸送技術、または重機械の操作
5. 自傷行為または他人への危害、自殺、切り傷、および摂食障害を含む
6. 個人に対する暴力、虐待、または身体的危害を扇動または促進することを意図したいかなるコンテンツ
他人を意図的に欺瞞または誤解させること、Llama 3.2を以下に関連して使用することを含む：
1. 詐欺を生成し、促進し、またはさらに進めること、または虚偽情報の作成または促進
2. 中傷的なコンテンツを生成し、促進し、またはさらに進めること、中傷的な声明、画像、またはその他のコンテンツの作成を含む
3. スパムを生成し、促進し、またはさらに配布すること
4. 同意、許可、または法的権利なしに他人になりすますこと
5. Llama 3.2の使用または出力が人間によって生成されたものであると表現すること
6. 偽のオンラインエンゲージメントを生成または容易にすること、偽のレビューおよびその他の偽のオンラインエンゲージメントの手段を含む
あなたのAIシステムの既知の危険性をエンドユーザーに適切に開示しないこと
違法なコンテンツを生成するように設計された第三者のツール、モデル、またはソフトウェアと対話すること、または不法または有害な行為を行うこと、および/または当該ツール、モデル、またはソフトウェアの出力がMetaまたはLlama 3.2に関連するものと表現すること

Llama 3.2に含まれるマルチモーダルモデルに関して、Llama 3.2コミュニティライセンス契約の第1条(a)に基づいて付与される権利は、あなたが欧州連合に居住する個人、または主たる事業場が欧州連合にある会社である場合、あなたには付与されません。この制限は、当該マルチモーダルモデルを組み込んだ製品またはサービスのエンドユーザーには適用されません。

このポリシーの違反、ソフトウェアの「バグ」、またはこのポリシーの違反につながる可能性のあるその他の問題は、以下のいずれかの方法で報告してください。

モデルの問題の報告: https://github.com/meta-llama/llama-models/issues
モデルによって生成された危険なコンテンツの報告: developers.facebook.com/llama_output_feedback
バグおよびセキュリティ上の懸念の報告: facebook.com/whitehat/info
許容使用ポリシーの違反またはLlama 3.2の無許可使用の報告: LlamaUseReport@meta.com

📋 モデル情報

属性	详情
サポート言語	en, de, fr, it, pt, hi, es, th
ライブラリ名	transformers
パイプラインタグ	image-text-to-text
タグ	facebook, meta, pytorch, llama, llama-3
ライセンス	llama3.2