Llama 3.2 11B Vision Instruct_カテゴリ| AIbaseモデルライブラリ

ホーム

Llama 3.2 11B Vision Instruct

meta-llamaによって開発

Llama 3.2はMetaがリリースした多言語マルチモーダル大規模言語モデルで、画像テキストからテキストへの変換タスクをサポートし、強力なクロスモーダル理解能力を備えています。

テキスト生成画像

Transformers

複数言語対応#マルチモーダル理解 #多言語サポート #画像テキストQA

ダウンロード数 784.19k

リリース時間 : 9/18/2024

モデル概要

Llama 3.2はTransformerアーキテクチャに基づくマルチモーダルモデルで、画像とテキスト入力を処理し、詳細なテキスト出力を生成できます。芸術分析、チャート理解、ドキュメントQAなど様々なシーンに適用可能です。

モデル特徴

マルチモーダル理解

画像とテキスト入力を同時に処理し、一貫性のある詳細なテキスト出力を生成できます。

多言語サポート

英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語など複数の言語をサポートしています。

芸術とチャート分析

芸術作品の時代的特徴やスタイルを分析し、チャートから重要な情報を抽出できます。

ドキュメントQA

請求書などのドキュメントから重要な情報を抽出し、関連する質問に答えることができます。

モデル能力

画像理解

テキスト生成

クロスモーダル推論

多言語処理

芸術スタイル分析

チャートデータ抽出

ドキュメント情報抽出

使用事例

芸術分析

ロココ芸術分析

ロココ芸術作品のスタイル特徴と時代背景を分析します。

ロココ時代の芸術的特徴を詳細に説明でき、柔らかな色彩、曲線的なライン、複雑な装飾ディテールなどを含みます。

チャート理解

干ばつ地域分析

チャートから干ばつが発生した地域情報を抽出します。

2016年に深刻な干ばつに見舞われた地域（東部および南部アフリカなど）を正確に識別してリストアップできます。

ドキュメントQA

請求書日付計算

請求書から日付情報を抽出し、時間差を計算します。

請求書日付と支払期日との間の日数差（15日など）を正確に計算できます。

🚀 トランスフォーマー

このライブラリは、画像とテキストを入力としてテキストを出力する機能を提供します。FacebookやMetaによって開発されたLlama 3.2モデルをベースにしています。

🚀 クイックスタート

このライブラリの使用例をいくつか紹介します。

ロココ美術の例

ユーザー: この作品はどの時代のものですか？その時代について詳しく教えてください。
画像URL: https://huggingface.co/datasets/huggingface/release-assets/resolve/main/rococo.jpg

アシスタント: この作品は、赤いドレスを着た女性が黄金色と白色の華やかな装飾に囲まれた絵です。女性は空中に描かれており、腕を広げ、膝を曲げています。右手には花束を、左手には果物を持っています。

絵の背景はピンク色の雲が漂う淡い青空で、女性の周りにはピンクの花や緑の葉もあります。絵全体の雰囲気は喜びと祝祭の感じがあり、女性が踊っているか何かを祝っているかのようです。

この作品は、18世紀にヨーロッパで登場した美術や建築のスタイルであるロココ時代のものです。ロココスタイルは、パステルカラー、曲線、華やかな装飾の使用が特徴です。このスタイルは、1715年から1774年に統治したフランスのルイ15世の治世中に普及しました。

図表理解の例

ユーザー: この図表によると、干ばつはどこで起こっていますか？
画像URL: https://huggingface.co/datasets/huggingface/release-assets/resolve/main/weather_events.png

アシスタント: # 2016年の干ばつ地域

この図表によると、2016年に深刻な干ばつに見舞われた地域は以下の通りです。

- **東アフリカと南アフリカ**：この地域は干ばつの影響を受け、農業や水資源に大きな影響がありました。
- **西アフリカと南アフリカ**：この地域でも干ばつが発生し、食糧不安やその他の問題を引き起こしました。

これらの地域は2016年に干ばつに特に脆弱であり、効果的な水管理戦略と気候変動への耐性向上策が必要であることを示しています。

書類QAの例

ユーザー: 請求書の日付から支払期限までの期間はどれくらいですか？簡潔に答えてください。
画像URL: https://huggingface.co/datasets/huggingface/release-assets/resolve/main/invoice.png

アシスタント: 請求書の日付と支払期限の間の期間を決定するには、これら2つの日付の差を計算する必要があります。

請求書日付: 2019年2月11日
支払期限: 2019年2月26日

ステップ1: 日数の差を計算する

2月26日 - 2月11日 = 15日

したがって、請求書の日付から支払期限までの期間は15日です。

📄 ライセンス

このライブラリはLlama 3.2コミュニティライセンスの下で提供されています。詳細なライセンス条項は以下の通りです。

LLAMA 3.2コミュニティライセンス契約

Llama 3.2バージョンリリース日: 2024年9月25日

「契約」とは、本書に定めるLlama素材の使用、複製、配布、改変に関する条件を意味します。

「ドキュメント」とは、Metaがhttps://llama.meta.com/doc/overviewで配布するLlama 3.2に付随する仕様書、マニュアル、およびドキュメントを意味します。

「ライセンシー」または「あなた」とは、あなた、またはあなたの雇用主、またはあなたがその者または団体のために本契約に入る場合のその他の者または団体を意味し、適用される法律、規則、または規制に基づき法的同意を与えるために必要な年齢であり、あなたが彼らのために本契約に入る場合にあなたの雇用主またはその他の者または団体を拘束する法的権限を有する者を意味します。

「Llama 3.2」とは、Metaがhttps://www.llama.com/llama-downloadsで配布する、機械学習モデルコード、学習済みモデルの重み、推論を可能にするコード、学習を可能にするコード、微調整を可能にするコード、およびその他の要素を含む、基礎的な大規模言語モデル、ソフトウェア、およびアルゴリズムを意味します。

「Llama素材」とは、総称して、本契約の下で提供されるMetaの独自のLlama 3.2およびドキュメント（およびその一部）を意味します。

「Meta」または「私たち」とは、あなたが欧州経済地域（EEA）またはスイスに所在する場合、またはあなたが団体である場合にあなたの主たる事業場がEEAまたはスイスにある場合にはMeta Platforms Ireland Limitedを、あなたがEEAまたはスイスの外に所在する場合にはMeta Platforms, Inc.を意味します。

以下の「同意する」をクリックするか、またはLlama素材の一部または要素を使用または配布することにより、あなたは本契約に拘束されることに同意するものとします。

ライセンス権利と再配布

a. 権利の付与。あなたには、Llama素材に含まれるMetaの知的財産またはMetaが所有するその他の権利の下で、非排他的、世界規模、非譲渡可能、無償の限定的ライセンスが付与され、Llama素材を使用、複製、配布、コピー、派生物を作成、および改変することができます。

b. 再配布と使用

i. あなたがLlama素材（またはその派生物）、またはそれらを含む製品もしくはサービス（他のAIモデルを含む）を配布または提供する場合、あなたは（A）そのようなLlama素材とともに本契約のコピーを提供し、（B）関連するウェブサイト、ユーザーインターフェイス、ブログ記事、アバウトページ、または製品ドキュメントに「Built with Llama」を目立つように表示するものとします。あなたがLlama素材またはLlama素材の出力もしくは結果を使用してAIモデルを作成、学習、微調整、またはその他の方法で改善し、それを配布または提供する場合、あなたはそのようなAIモデルの名前の先頭に「Llama」を含めるものとします。

ii. あなたが統合されたエンドユーザー製品の一部としてLlama素材またはその派生物をライセンシーから受け取った場合、本契約の第2条はあなたには適用されません。

iv. あなたのLlama素材の使用は、適用される法律および規制（貿易コンプライアンスの法律および規制を含む）に準拠し、Llama素材の許容使用ポリシー（https://www.llama.com/llama3_2/use-policyで入手可能）に従うものとし、これは本契約に参照により組み込まれるものとします。

追加の商用条項。Llama 3.2バージョンリリース日に、ライセンシーまたはライセンシーの関連会社によって提供される製品またはサービスの月間アクティブユーザー数が前の暦月において7億人を超える場合、あなたはMetaからライセンスを申請する必要があり、Metaはその裁量によりあなたにライセンスを付与することができます。Metaが明示的にそのような権利をあなたに付与するまで、あなたは本契約に基づくいずれの権利も行使することができません。
保証の否認。適用される法律により要求されない限り、Llama素材およびそれから得られるすべての出力および結果は「現状のまま」で提供され、いかなる種類の保証もなく、Metaはすべての種類の保証（明示的および黙示的なものを含む）を否認します。これには、所有権、非侵害、商品性、または特定の目的への適合性に関する保証が含まれます。あなたは、Llama素材を使用または再配布する適切性を独自に判断し、Llama素材の使用およびそれから得られるすべての出力および結果に関連するすべてのリスクを負うものとします。
責任の制限。いかなる場合も、Metaまたはその関連会社は、本契約に起因するいかなる理論に基づく責任（契約、不法行為、過失、製品責任、またはその他のものを含む）について、利益損失または間接的、特殊、結果的、偶発的、懲罰的な損害について責任を負わないものとします。たとえMetaまたはその関連会社がそれらの可能性について通知されていたとしても同様です。
知的財産

a. 本契約の下で商標ライセンスは付与されず、Llama素材に関連して、Metaまたはライセンシーは、相手またはその関連会社が所有するまたは関連するいかなる名前または標章も使用することができません。ただし、Llama素材を説明および再配布するための合理的かつ慣習的な使用に必要な場合、または本条5(a)に定める場合を除きます。Metaは、あなたに対して、第1.b.i項の最後の文に従うために必要な場合にのみ「Llama」（「標章」）を使用するライセンスを付与します。あなたはMetaのブランドガイドライン（現在はhttps://about.meta.com/brand/resources/meta/company-brand/でアクセス可能）に従うものとします。あなたが標章を使用することにより生じるすべての営業権はMetaの利益に帰属するものとします。

b. MetaによるまたはMetaのためのLlama素材および派生物の所有権に関して、あなたが作成したLlama素材の派生物および改変については、あなたとMetaの間で、あなたがそれらの派生物および改変の所有者であり、かつ所有者であり続けるものとします。

c. あなたがMetaまたはいかなる団体に対して訴訟またはその他の手続きを提起し（訴訟における反訴または反請求を含む）、Llama素材またはLlama 3.2の出力もしくは結果、またはそれらの一部があなたが所有するまたはライセンスすることができる知的財産またはその他の権利の侵害を構成すると主張する場合、本契約の下であなたに付与されたすべてのライセンスは、その訴訟または請求が提起された日から終了するものとします。あなたは、Llama素材の使用または配布に起因するまたは関連するいかなる第三者による請求からMetaを弁護し、損害を与えないようにするものとします。

契約期間と終了。本契約の期間は、あなたが本契約に同意するか、またはLlama素材にアクセスすることにより開始し、本契約の条件に従って終了するまで有効です。Metaは、あなたが本契約のいかなる条項または条件に違反した場合には、本契約を終了することができます。本契約が終了した場合、あなたはLlama素材を削除し、使用を停止するものとします。第3条、第4条、および第7条は、本契約の終了後も有効です。
準拠法と管轄権。本契約は、法の選択の原則を考慮することなく、カリフォルニア州の法律に基づいて解釈および適用されるものとします。国際商品売買契約に関する国際連合条約は本契約に適用されません。カリフォルニア州の裁判所は、本契約に起因するいかなる紛争についても排他的な管轄権を有するものとします。

Llama 3.2許容使用ポリシー

Metaは、Llama 3.2を含むツールや機能の安全で公正な使用を促進することにコミットしています。あなたがLlama 3.2にアクセスまたは使用する場合、この許容使用ポリシー（「ポリシー」）に同意するものとします。このポリシーの最新版はhttps://www.llama.com/llama3_2/use-policyで確認できます。

禁止される使用

私たちは、誰もがLlama 3.2を安全かつ責任を持って使用することを望んでいます。あなたは、Llama 3.2を、または他人にLlama 3.2を使用させることを以下の目的で行わないことに同意するものとします。

法律または他人の権利を侵害すること。これには以下のことが含まれます。
1. 違法または不法な活動またはコンテンツを行い、促進し、生成し、寄与し、助長し、計画し、扇動し、またはさらに進めること。例えば以下のようなものです。
  1. 暴力またはテロリズム
  2. 児童の搾取または危害。これには、児童搾取コンテンツの勧誘、作成、取得、または配布、または児童性虐待素材の通報漏れが含まれます。
  3. 人身売買、搾取、および性的暴力
  4. 未成年者への情報または資料の違法な配布。これには猥褻な資料が含まれ、またはそのような情報または資料に関連して法律で要求される年齢制限を設けないこと。
  5. 性的勧誘
  6. その他の犯罪行為
2. 個人または個人のグループに対する嫌がらせ、虐待、脅迫、またはいじめを行い、促進し、扇動し、または容易にすること
3. 雇用、雇用福利、信用、住宅、その他の経済的利益、またはその他の重要な商品やサービスの提供における差別またはその他の不法または有害な行為を行い、促進し、扇動し、または容易にすること
4. 金融、法律、医療/健康、または関連する専門職を含むがこれに限定されないいかなる職業の無許可または無免許の実践を行うこと
5. 個人に関する個人情報または機微な情報（個人の身元、健康、または人口統計情報を含む）を収集、処理、開示、生成、または推測すること。ただし、適用される法律に従ってその権利を取得している場合を除きます。
6. 第三者の権利を侵害、盗用、またはその他の方法で違反するいかなる行動またはコンテンツを行い、または容易にすること。これには、Llama素材を使用する製品またはサービスの出力または結果が含まれます。
7. 悪意のあるコード、マルウェア、コンピュータウイルスを作成、生成、または容易にすること、またはウェブサイトまたはコンピュータシステムの正常な動作、整合性、操作、または外観を無効化、過負荷、妨害、または損なうことができるその他のことを行うこと
8. Metaによって無効化された機能を有効にするために、使用制限またはその他の安全対策を意図的に回避または削除するいかなる行動を行い、または容易にすること
個人に対する死亡または身体的危害のリスクをもたらす活動の計画または開発を行い、促進し、扇動し、容易にし、または支援すること。これには、Llama 3.2を以下の目的で使用することが含まれます。 8. 軍事、戦争、原子力産業または応用、諜報活動、米国国務省が維持する国際武器輸出規制（ITAR）、または1989年の米国生物兵器テロ防止法、または1997年の化学兵器条約実施法の対象となる素材または活動に関するもの 9. 銃器および違法武器（武器開発を含む） 10. 違法薬物および規制/管理物質 11. 重要インフラストラクチャ、輸送技術、または重機械の操作 12. 自傷行為または他人への危害。これには自殺、切り傷、および摂食障害が含まれます。 13. 個人に対する暴力、虐待、または身体的危害を扇動または促進することを意図したいかなるコンテンツ
他人を意図的に欺瞞または誤解させること。これには、Llama 3.2を以下の目的で使用することが含まれます。（原文未完了）