ヘロンプレリミナリーGitラマ2－70b－v0オープンソースビジュアル言語モデル

ホーム

Heron Preliminary Git Llama 2 70b V0

turing-motorsによって開発

画像-テキストペアで事前学習された視覚言語モデルで、Llama-2 70Bアーキテクチャに基づき、画像キャプション生成タスクに適しています。

画像生成テキスト

Transformers

日本語#画像キャプション生成 #マルチモーダルアダプター #日本語視覚理解

ダウンロード数 14

リリース時間 : 9/7/2023

モデル概要

このモデルはGITアダプターを使用し、M3IT Coco Captionsデータセットで訓練され、主に画像からテキストへの変換タスクに使用されます。

モデル特徴

視覚言語理解

画像内容を理解し、対応するテキスト記述を生成可能

大規模モデルアーキテクチャ

Llama-2 70B大規模言語モデルを基盤とし、強力な言語理解能力を備える

GITアダプター

GIT(GenerativeImage2Text)アーキテクチャを使用し、画像からテキストへの変換を実現

モデル能力

画像理解

テキスト生成

画像キャプション生成

使用事例

コンピュータビジョン

画像自動タグ付け

画像に対して自動的に記述テキストを生成

支援ツール

視覚支援

視覚障害者向けに画像内容の説明を提供

🚀 Heron GIT Llama 2 70B Preliminary

Heron GIT Llama 2 70B Preliminaryは、画像とテキストのペアを用いて事前学習されたビジョン言語モデルです。このモデルは、画像からテキストを生成するタスクに特化しており、チャットアプリケーションや研究目的に利用できます。

🚀 クイックスタート

インストールガイドに従って、モデルを使用できる環境をセットアップしてください。

✨ 主な機能

画像とテキストのペアを用いた事前学習により、画像から適切なテキストを生成することができます。
GITアダプタを使用しており、Llama-2 70B chat hfと組み合わせることで高性能を発揮します。

📦 インストール

インストールガイドを参照して、モデルをインストールしてください。

📚 ドキュメント

モデルの詳細

開発者: Turing Inc.
アダプタタイプ: GIT
言語モデル: Llama-2 70B chat hf
言語: 英語
ライセンス: このモデルはLLAMA 2 Community Licenseの下でライセンスされています。

学習について

このモデルは、Adaptorを使用してM3IT Coco Captionsで学習されました。

学習データセット

MMInstruction M3IT

使用目的と制限事項

使用目的

このモデルは、チャットアプリケーションや研究目的での使用を想定しています。

制限事項

このモデルは、不正確または誤った情報を生成する可能性があり、その精度は保証されません。まだ研究開発段階にあります。

引用方法

@misc{GitElyzaFast, 
    url    = {[https://huggingface.co/turing-motors/heron-preliminary-git-Llama-2-70b-v0](https://huggingface.co/turing-motors/heron-preliminary-git-Llama-2-70b-v0)}, 
    title  = {Heron GIT Llama 2 70B Preliminary}, 
    author = {Yuichi Inoue, Kotaro Tanahashi, and Yu Yamaguchi}
}

参考文献

@misc{touvron2023llama,
      title={Llama 2: Open Foundation and Fine-Tuned Chat Models}, 
      author={Hugo Touvron and Louis Martin and Kevin Stone and Peter Albert and Amjad Almahairi and Yasmine Babaei and Nikolay Bashlykov and Soumya Batra and Prajjwal Bhargava and Shruti Bhosale and Dan Bikel and Lukas Blecher and Cristian Canton Ferrer and Moya Chen and Guillem Cucurull and David Esiobu and Jude Fernandes and Jeremy Fu and Wenyin Fu and Brian Fuller and Cynthia Gao and Vedanuj Goswami and Naman Goyal and Anthony Hartshorn and Saghar Hosseini and Rui Hou and Hakan Inan and Marcin Kardas and Viktor Kerkez and Madian Khabsa and Isabel Kloumann and Artem Korenev and Punit Singh Koura and Marie-Anne Lachaux and Thibaut Lavril and Jenya Lee and Diana Liskovich and Yinghai Lu and Yuning Mao and Xavier Martinet and Todor Mihaylov and Pushkar Mishra and Igor Molybog and Yixin Nie and Andrew Poulton and Jeremy Reizenstein and Rashi Rungta and Kalyan Saladi and Alan Schelten and Ruan Silva and Eric Michael Smith and Ranjan Subramanian and Xiaoqing Ellen Tan and Binh Tang and Ross Taylor and Adina Williams and Jian Xiang Kuan and Puxin Xu and Zheng Yan and Iliyan Zarov and Yuchen Zhang and Angela Fan and Melanie Kambadur and Sharan Narang and Aurelien Rodriguez and Robert Stojnic and Sergey Edunov and Thomas Scialom},
      year={2023},
      eprint={2307.09288},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}