🚀 OpenCALM-Large
OpenCALMは、株式会社サイバーエージェントによって開発された、日本語データセットで事前学習されたデコーダー専用の言語モデル群です。
🚀 クイックスタート
OpenCALM-Largeモデルを使用するには、以下の手順に従ってください。
💻 使用例
基本的な使用法
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("cyberagent/open-calm-large", device_map="auto", torch_dtype=torch.float16)
tokenizer = AutoTokenizer.from_pretrained("cyberagent/open-calm-large")
inputs = tokenizer("AIによって私達の暮らしは、", return_tensors="pt").to(model.device)
with torch.no_grad():
tokens = model.generate(
**inputs,
max_new_tokens=64,
do_sample=True,
temperature=0.7,
top_p=0.9,
repetition_penalty=1.05,
pad_token_id=tokenizer.pad_token_id,
)
output = tokenizer.decode(tokens[0], skip_special_tokens=True)
print(output)
📚 ドキュメント
モデルの詳細
- 開発元: 株式会社サイバーエージェント
- モデルタイプ: Transformerベースの言語モデル
- 言語: 日本語
- ライブラリ: GPT-NeoX
- ライセンス: OpenCALMは、クリエイティブ・コモンズ 表示 - 継承 4.0 国際ライセンス(CC BY-SA 4.0)の下でライセンスされています。このモデルを使用する際は、株式会社サイバーエージェントに適切なクレジットを表示してください。
- 例 (英語): This model is a fine-tuned version of OpenCALM-XX developed by CyberAgent, Inc. The original model is released under the CC BY-SA 4.0 license, and this model is also released under the same CC BY-SA 4.0 license. For more information, please visit: https://creativecommons.org/licenses/by-sa/4.0/
- 例 (日本語): 本モデルは、株式会社サイバーエージェントによるOpenCALM-XXをファインチューニングしたものです。元のモデルはCC BY-SA 4.0ライセンスのもとで公開されており、本モデルも同じくCC BY-SA 4.0ライセンスで公開します。詳しくはこちらをご覧ください: https://creativecommons.org/licenses/by-sa/4.0/
学習データセット
- Wikipedia (日本語)
- Common Crawl (日本語)
作者
石上涼介
引用
@software{gpt-neox-library,
title = {{GPT-NeoX: Large Scale Autoregressive Language Modeling in PyTorch}},
author = {Andonian, Alex and Anthony, Quentin and Biderman, Stella and Black, Sid and Gali, Preetham and Gao, Leo and Hallahan, Eric and Levy-Kramer, Josh and Leahy, Connor and Nestler, Lucas and Parker, Kip and Pieler, Michael and Purohit, Shivanshu and Songz, Tri and Phil, Wang and Weinbach, Samuel},
url = {https://www.github.com/eleutherai/gpt-neox},
doi = {10.5281/zenodo.5879544},
month = {8},
year = {2021},
version = {0.0.1},
}