calm2 - 7b（CyberAgentLM2）オープンソース言語モデル - 日英データセットに基づく言語処理アプリケーションの実現

ホーム

Calm2 7b

cyberagentによって開発

CyberAgentLM2は、公開可能な日本語と英語のデータセットに基づき、1.3兆トークンを事前学習したデコーダー専用の言語モデルです。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #日本語最適化 #兆規模の事前学習 #長文生成

ダウンロード数 748

リリース時間 : 11/1/2023

モデル概要

CyberAgentLM2は、主に日本語と英語のテキスト生成タスク向けのTransformerベースの言語モデルです。

モデル特徴

大規模事前学習

1.3兆トークンで事前学習されており、強力な言語理解能力を備えています。

二言語サポート

日本語と英語の2言語でのテキスト生成をサポートしています。

長文脈処理

4096トークンのコンテキスト長をサポートし、長文タスクに適しています。

モデル能力

日本語テキスト生成

英語テキスト生成

因果的言語モデリング

使用事例

テキスト生成

日本語記事の続き作成

与えられた日本語のプロンプトに基づき、一貫性のある記事内容を生成します。

英語コンテンツ作成

英語のプロンプトに基づき、様々な種類のテキストコンテンツを生成します。

🚀 CyberAgentLM2-7B (CALM2-7B)

CyberAgentLM2は、公開されている日本語と英語のデータセットの1.3Tトークンで事前学習されたデコーダー専用の言語モデルです。このモデルは、日本語と英語の自然言語処理タスクに役立ちます。

🚀 クイックスタート

CyberAgentLM2を使用するには、必要なライブラリをインストールし、以下のコード例を参考にしてください。

📦 インストール

このモデルを使用するには、以下のライブラリが必要です。

transformers >= 4.34.1
accelerate

💻 使用例

基本的な使用法

import transformers
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

assert transformers.__version__ >= "4.34.1"

model = AutoModelForCausalLM.from_pretrained("cyberagent/calm2-7b", device_map="auto", torch_dtype="auto")
tokenizer = AutoTokenizer.from_pretrained("cyberagent/calm2-7b")
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

prompt = "AIによって私達の暮らしは、"

token_ids = tokenizer.encode(prompt, return_tensors="pt")
output_ids = model.generate(
    input_ids=token_ids.to(model.device),
    max_new_tokens=100,
    do_sample=True,
    temperature=0.9,
    streamer=streamer,
)

📚 ドキュメント

モデルの詳細

属性	详情
モデルサイズ	7B
学習トークン数	1.3Tトークン
コンテキスト長	4096
モデルタイプ	Transformerベースの言語モデル
言語	日本語、英語
開発元	CyberAgent, Inc.
ライセンス	Apache-2.0

著者

Ryosuke Ishigami

引用

@article{touvron2023llama,
  title={LLaMA: Open and Efficient Foundation Language Models},
  author={Touvron, Hugo and Lavril, Thibaut and Izacard, Gautier and Martinet, Xavier and Lachaux, Marie-Anne and Lacroix, Timoth{\'e}e and Rozi{\`e}re, Baptiste and Goyal, Naman and Hambro, Eric and Azhar, Faisal and Rodriguez, Aurelien and Joulin, Armand and Grave, Edouard and Lample, Guillaume},
  journal={arXiv preprint arXiv:2302.13971},
  year={2023}
}