ChessGPT-chat-v1オープンソース対話モデル - 無料でデプロイ可能、チェス分野の質問応答に特化

ホーム

Chessgpt Chat V1

Waterhorseによって開発

Chessgpt-Base-v1を基に教師あり微調整(SFT)を行った28億パラメータの対話モデルで、チェス分野に特化

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #チェス対話 #28億パラメータ #戦略学習

ダウンロード数 218

リリース時間 : 6/3/2023

モデル概要

チェス分野に特化した対話型言語モデルで、チェス関連の質問への対応や議論をサポート

モデル特徴

チェス専門分野最適化

チェス分野に特化した訓練により、チェス関連の内容を理解・生成可能

対話能力

マルチターン対話をサポートし、チェス関連の質問に理解・応答可能

オープンソースライセンス

Apache 2.0ライセンスを採用し、商用・研究利用を許可

モデル能力

チェス知識QA

チェス序盤分析

チェス用語解説

マルチターン対話

使用事例

チェス学習

序盤分析

チェスの序盤に関する質問に回答

シシリアン・ディフェンスなどの一般的な序盤を正確に識別・解説可能

棋譜討論

特定の棋譜に関する議論に参加

AI研究

戦略学習研究

言語モデルの戦略学習分野への応用研究に利用

🚀 チェスGPTチャットv1

チェスGPTチャットv1は、チェスGPTベースv1をSFT（Supervised Fine-Tuning）で調整したモデルです。このモデルは、チェスに関連する自然言語処理タスクに特化しており、チェスのオープニングや戦略に関する質問に回答することができます。

ベースモデル: チェスGPTベースv1
チャットバージョン: チェスGPTチャットv1

また、我々は次世代モデルであるChessGPT-V2の開発に積極的に取り組んでいます。チェス関連のデータセットに関する貢献を歓迎します。関連事項については、xidong.feng.20@ucl.ac.ukまでご連絡ください。

🚀 クイックスタート

このモデルを使用するには、8GB以上のメモリを持つGPUが必要です。以下のコード例を参考に、モデルを初期化して推論を行ってください。

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("Waterhorse/chessgpt-chat-v1")
model = AutoModelForCausalLM.from_pretrained("Waterhorse/chessgpt-chat-v1", torch_dtype=torch.float16)
model = model.to('cuda:0')

# infer
# Conversation between two
prompt = "A friendly, helpful chat between some humans.<|endoftext|>Human 0: 1.e4 c5, what is the name of this opening?<|endoftext|>Human 1:"
# Conversation between more than two
#prompt = "A friendly, helpful chat between some humans.<|endoftext|>Human 0: 1.e4 c5, what is the name of this opening?<|endoftext|>Human 1: Sicilian defense.<|endoftext|>Human 2:"

inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True,
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)

✨ 主な機能

チェス関連の質問応答: チェスのオープニングや戦略に関する質問に回答することができます。
多者間の会話対応: 複数のユーザー間の会話をサポートしています。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールしてください。

pip install transformers

📚 ドキュメント

モデル詳細

属性	詳情
モデルタイプ	言語モデル
言語	英語
ライセンス	Apache 2.0
モデル説明	チェスに関する28億パラメータの事前学習言語モデル

利用方法

直接利用

チェスGPTチャットv1は、大規模言語モデルの研究、特にポリシー学習や言語モデリングに関する研究に主に使用されます。

適用範囲外の利用

チェスGPTチャットv1はチェス関連のデータで学習された言語モデルであり、チェスドメイン以外の他のユースケースでは性能が低下する可能性があります。

バイアス、リスク、制限事項

他の言語モデルと同様に、チェスGPTチャットv1には固有の制限があり、慎重な検討が必要です。具体的には、複雑または曖昧なクエリを解釈するタスクを行う際に、関係のないまたは誤った応答を生成することがあります。また、オンラインデータを基に学習されているため、一般的なオンラインのステレオタイプやバイアスを反映し、永続化する可能性があります。

評価

ベンチマーク結果については、我々の論文とコードを参照してください。

引用情報

@article{feng2023chessgpt,
  title={ChessGPT: Bridging Policy Learning and Language Modeling},
  author={Feng, Xidong and Luo, Yicheng and Wang, Ziyan and Tang, Hongrui and Yang, Mengyue and Shao, Kun and Mguni, David and Du, Yali and Wang, Jun},
  journal={arXiv preprint arXiv:2306.09200},
  year={2023}
}