楽天AI-7B-chatオープンソース多言語LLM - 無料でデプロイ可能、日本語と英語の両言語タスク処理に最適

Rakutenai 7B Chat

Rakutenによって開発

RakutenAI-7B-chatは楽天グループが開発した日本語大規模言語モデルで、日本語理解ベンチマークテストで優れた性能を発揮し、英語タスクもサポートしています。Mistral-7Bアーキテクチャを基に語彙表を拡張し日本語処理を最適化しました。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #日本語最適化 #バイリンガル対話 #命令微調整

ダウンロード数 3,702

リリース時間 : 3/18/2024

モデル概要

このモデルはRakutenAI-7Bの対話最適化バージョンで、自然言語インタラクション向けに設計されており、役立ち詳細で礼儀正しい回答を生成できます。

モデル特徴

日本語最適化処理

語彙表を48kに拡張することで日本語文字-トークン比を大幅に改善し、日本語ベンチマークテストで最高スコアを達成

バイリンガルサポート

英語タスク処理能力を維持しつつ、同類の日本語モデルと比較して競争力がある

対話最適化

命令チューニングにより対話インタラクションシーン向けに特別に最適化され、役立ち詳細な回答を生成

モデル能力

日本語テキスト生成

英語テキスト生成

マルチターン対話

質問応答システム

クロスランゲージ理解

使用事例

カスタマーサービス

日本語カスタマーサポートアシスタント

日本語の顧客問い合わせを処理し、自然で流暢な返答を提供

Japanese MT-bench評価で優れた性能

教育

言語学習アシスタント

日本語または英語学習者の言語練習を支援

🚀 RakutenAI-7B-chat

RakutenAI-7B-chatは、日本語の大規模言語モデル（LLM）の世界に最新技術をもたらすプロジェクトです。このモデルは、日本語理解のベンチマークで高いスコアを達成し、英語のテストセットでも同様のモデルと競争力を持ちます。

🚀 クイックスタート

RakutenAI-7Bは、日本語LLMの分野に革新をもたらすシステマティックな取り組みです。このモデルは、日本語理解のベンチマークで最高のスコアを達成し、英語のテストセットでもOpenCalm、Elyza、Youri、Nekomata、Swallowなどの同様のモデルの中でも競争力のあるパフォーマンスを維持しています。

技術レポートはarXivで入手できます。

ファウンデーションモデルを探している場合は、RakutenAI-7Bをチェックしてください。
命令調整済みのモデルを探している場合は、RakutenAI-7B-instructをチェックしてください。

Kamataらによる独立した評価では、llm-jp-evalとJapanese MT-benchの加重平均を使用したNejumi LLMリーダーボード Neoにおいて、2024年3月22日現在、RakutenAI-7Bのチャット/命令調整バージョンが同サイズのオープンLLMの中で最高のパフォーマンスを示しています。

✨ 主な機能

高性能：日本語理解のベンチマークで最高のスコアを達成し、英語のテストセットでも競争力のあるパフォーマンスを維持。
Mistralアーキテクチャ：Mistralモデルアーキテクチャを利用し、Mistral-7B-v0.1の事前学習チェックポイントをベースにしています。
拡張語彙：Mistralの語彙を32kから48kに拡張し、日本語の文字あたりのトークン率を向上させています。

💻 使用例

基本的な使用法

# With RakutenAI-7B-Chat's custom chat template.

from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "Rakuten/RakutenAI-7B-chat"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype="auto", device_map="auto")
model.eval()

chat = [
    
    {"role": "system", "content": "A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions."},
    {"role": "user", "content": "How to make an authentic Spanish Omelette?"},
]

input_ids = tokenizer.apply_chat_template(chat, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(device=model.device)
tokens = model.generate(
    input_ids,
    max_length=4096,
    do_sample=False,
    num_beams=1,
    pad_token_id=tokenizer.eos_token_id,
)
out = tokenizer.decode(tokens[0][len(input_ids[0]):], skip_special_tokens=True)
print("ASSISTANT:\n" + out)
print()


# Without using custom chat template.

from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "Rakuten/RakutenAI-7B-chat"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype="auto", device_map="auto")
model.eval()

requests = [
    "「馬が合う」はどう言う意味ですか",
    "How to make an authentic Spanish Omelette?",
]

system_message = "A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions. USER: {user_input} ASSISTANT:"

for req in requests:
    input_req = system_message.format(user_input=req)
    input_ids = tokenizer.encode(input_req, return_tensors="pt").to(device=model.device)
    tokens = model.generate(
        input_ids,
        max_new_tokens=1024,
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id,
    )
    out = tokenizer.decode(tokens[0][len(input_ids[0]):], skip_special_tokens=True)
    print("USER:\n" + req)
    print("ASSISTANT:\n" + out)
    print()
    print()

📚 ドキュメント

モデルの詳細

属性	详情
開発者	Rakuten Group, Inc.
言語	日本語、英語
ライセンス	このモデルはApache License, Version 2.0の下でライセンスされています。
命令調整データセット	ファウンデーションモデルを微調整してRakutenAI-7B-instructとRakutenAI-7B-chatを作成する際に、オープンソースと内部で作成したデータセットを混合して使用しています。以下のデータセットの`train`部分（CC by-SA License）を命令調整およびチャット調整モデルに使用しています。 - JSNLI - RTE - KUCI - BELEBELE - JCS - JNLI - Dolly-15K - OpenAssistant1

制限事項とバイアス

RakutenAI-7Bモデルは、幅広いトピックについて人間に近いテキストを生成することができます。しかし、すべてのLLMと同様に、制限事項があり、偏った、不正確な、または不安全な出力を生成する可能性があります。使用する際には、注意と判断力を行使してください。

📄 ライセンス

このモデルはApache License, Version 2.0の下でライセンスされています。

引用

RakutenAI-7Bモデルの研究を引用する場合は、以下を使用してください。

@misc{rakutengroup2024rakutenai7b,
      title={RakutenAI-7B: Extending Large Language Models for Japanese}, 
      author={{Rakuten Group, Inc.} and Aaron Levine and Connie Huang and Chenguang Wang and Eduardo Batista and Ewa Szymanska and Hongyi Ding and Hou Wei Chou and Jean-François Pessiot and Johanes Effendi and Justin Chiu and Kai Torben Ohlhus and Karan Chopra and Keiji Shinzato and Koji Murakami and Lee Xiong and Lei Chen and Maki Kubota and Maksim Tkachenko and Miroku Lee and Naoki Takahashi and Prathyusha Jwalapuram and Ryutaro Tatsushima and Saurabh Jain and Sunil Kumar Yadav and Ting Cai and Wei-Te Chen and Yandi Xia and Yuki Nakayama and Yutaka Higashiyama},
      year={2024},
      eprint={2403.15484},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}