RedPajama-INCITE-7B-Chatオープンソース対話モデル - 無料で利用して、スマートな対話交流を実現

ホーム

Redpajama INCITE 7B Chat

togethercomputerによって開発

Togetherが複数のAI研究機関と共同開発した69億パラメータの対話専用言語モデル。RedPajama-Data-1Tデータセットで訓練され、OASST1とDolly2データでファインチューニングされ対話能力を強化

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #英語対話最適化 #オープンソース大規模モデル #マルチタスク命令ファインチューニング

ダウンロード数 178

リリース時間 : 5/4/2023

モデル概要

対話シーンに最適化されたオープンソース大規模言語モデル。英語インタラクションをサポートし、様々なテキスト生成タスクに適用可能

モデル特徴

多機関共同開発

Ontocord.ai、ETH DS3Lab、MILAなどの一流AI研究機関が共同で開発に参加

命令ファインチューニング最適化

OASST1とDolly2データセットを使用したファインチューニングにより、対話応答品質を大幅に向上

柔軟なデプロイ方法

FP16/Int8量子化推論をサポートし、様々なハードウェア環境（GPU/CPU）に対応

モデル能力

オープンドメイン対話

メール作成

知識質問応答

コンテンツ作成

ブレインストーミング

使用事例

日常アシスタント

メール作成

ユーザーが招待メールなどの日常文書を迅速に生成するのを支援

社交マナーに沿った招待内容を生成できることが例示

情報相談

人物百科

歴史人物/科学概念に関する基礎的な質問に回答

アラン・チューリングなどの有名人の基本情報を正確に記述可能

旅行計画

観光地推薦

都市の遊びリストと提案を生成

サンフランシスコなどの都市の代表的な観光地を列挙可能

🚀 RedPajama-INCITE-7B-Chat

RedPajama-INCITE-7B-Chatは、Togetherと、Ontocord.ai、ETH DS3Lab、AAI CERC、モントリオール大学、MILA - ケベックAI研究所、スタンフォード大学基盤モデル研究センター（CRFM）、スタンフォード大学Hazy Research研究グループ、LAIONを含むオープンソースAIコミュニティのリーダーによって開発されました。

このモデルは、OASST1とDolly2でファインチューニングされ、チャット能力が強化されています。

ベースモデル: RedPajama-INCITE-7B-Base
命令微調整版: RedPajama-INCITE-7B-Instruct
チャット版: RedPajama-INCITE-7B-Chat

🚀 クイックスタート

このモデルでは、transformersバージョンが4.25.1以上が必要です。

チャットモデルにプロンプトを与えるには、以下の形式を使用してください。

<human>: [命令文]
<bot>:

✨ 主な機能

GPU推論

これには16GBのメモリを持つGPUが必要です。

GPUでのInt8推論

これには12GBのメモリを持つGPUが必要です。

CPU推論

CPUでも推論が可能です。ただし、LayerNormKernelImplがCPUのfp16では実装されていないため、CPU推論ではbfloat16を使用します。

📦 インストール

GPUでのInt8推論を行う場合、accelerateとbitsandbytesをインストールする必要があります。以下のコマンドでインストールできます。

pip install accelerate
pip install bitsandbytes

💻 使用例

基本的な使用法

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat", torch_dtype=torch.float16)
model = model.to('cuda:0')
# infer
prompt = "<human>: Who is Alan Turing?\n<bot>:"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
Alan Mathison Turing (23 June 1912  7 June 1954) was an English computer scientist, mathematician, logician, cryptanalyst, philosopher, mathematician, and theoretical biologist.
"""

高度な使用法

GPUでのInt8推論

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat", device_map='auto', torch_dtype=torch.float16, load_in_8bit=True)

# infer
prompt = "<human>: Who is Alan Turing?\n<bot>:"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
Alan Mathison Turing (23 June 1912 – 7 June 1954) was an English computer scientist, mathematician, logician, cryptanalyst, philosopher, and theoretical biologist.
"""

CPU推論

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Chat", torch_dtype=torch.bfloat16)
# infer
prompt = "<human>: Who is Alan Turing?\n<bot>:"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
Alan Mathison Turing, OBE, FRS, (23 June 1912 – 7 June 1954) was an English computer scientist, mathematician, logician, cryptanalyst, philosopher, and theoretical biologist.
"""

📚 ドキュメント

モデルの詳細

属性	详情
開発者	Together Computer
モデルタイプ	言語モデル
言語	英語
ライセンス	Apache 2.0
モデル説明	69億パラメータの事前学習言語モデル

利用方法

直接利用

以下に除外される利用方法について説明します。

誤用、悪意のある利用、範囲外の利用

エンドユーザーは、モデルを責任ある倫理的な方法で使用することを保証する責任があります。

範囲外の利用

RedPajama-INCITE-7B-Chatは言語モデルであり、意図された範囲外の他のユースケースではうまく機能しない場合があります。たとえば、安全上重要なアプリケーションや、個人や社会に重大な影響を与える決定を行うために使用するのに適していない場合があります。モデルの制限を考慮し、意図された目的のためにのみ使用することが重要です。

誤用と悪意のある利用

RedPajama-INCITE-7B-Chatは言語モデリング用に設計されています。モデルを違法または非倫理的な活動に利用するなどの誤用は、厳しく禁止されており、プロジェクトの原則に反します。

モデルを使用して個人に残酷な内容を生成することは、このモデルの誤用です。これには、以下が含まれますが、これらに限定されません。

偽のニュース、誤情報、または宣伝を生成する
個人またはグループに対する憎しみの言葉、差別、または暴力を宣伝する
本人の同意なしに個人または組織をなりすます
サイバーいじめや嫌がらせを行う
中傷的な内容
スパムまたは詐欺
適切な許可なしに機密または敏感な情報を共有する
モデルまたはそれを訓練するために使用されるデータの利用規約に違反する
マルウェアの拡散、フィッシング詐欺、またはスパムなどの悪意のある目的のために自動ボットを作成する

制限事項

RedPajama-INCITE-7B-Chatは、他の言語モデルと同様に、考慮すべき制限があります。たとえば、モデルは常に正確または関連性のある回答を提供するとは限らず、特に複雑であいまいな質問や、訓練データの範囲外の質問に対してはそうです。したがって、個人や組織からの貢献を歓迎し、より堅牢で包括的なチャットボットを作成するための協力を奨励します。