gpt2-open-instruct-v1-Anthropic-hh-rlhfオープンソース対話モデル - 無料デプロイ、会話プロンプトに正確に応答

ホーム

Gpt2 Open Instruct V1 Anthropic Hh Rlhf

jtatmanによって開発

GPT2-open-instructをベースに、Anthropic/hh-rlhfデータセットで微調整された対話モデルで、対話シーンのプロンプトに対する応答に長けています。

大規模言語モデル

Transformers

英語オープンソースライセンス:MIT #対話微調整 #RLHF最適化 #短いテキスト応答

ダウンロード数 125

リリース時間 : 7/22/2023

モデル概要

このモデルは、vicgalle/gpt2-open-instruct-v1をベースに、Anthropic/hh-rlhfデータセットのサブセットで微調整されたバージョンで、主に対話シーンの指令応答に使用されます。

モデル特徴

対話シーン最適化

「Human:」と「Assistant:」の対話形式に特化して最適化されています。

短いテキスト生成の優位性

短いテキストの返答シーンでより良い性能を発揮します。

RLHF適合

一部のRLHFアダプターを通じて言語モデルのヘッドを再構築しました。

モデル能力

対話生成

指令応答

短いテキスト生成

使用事例

対話システム

対話応答生成

ユーザーの入力に基づいて対話応答を生成します。

評価セットで2.1534の損失値を達成しました。

🚀 hh-rlhf

このモデルは、vicgalle/gpt2-open-instruct-v1 を Anthropic/hh-rlhf データセットのサブセット（15k）でファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 2.1534

このモデルは、会話シチュエーションにおいて 'Human:' または 'Assistant:' のプロンプトに対してかなり良い応答を返します。

短い応答の方が適しています。生成長を適切な範囲に抑えてください。放置すると、かなり難解な応答を返すことがあります。

これには、かなり無修正の発言や時には暴力的な爆発的な応答が含まれます。特に質問をする場合に顕著です。

他のテキスト用途については、精査が必要です。

Human: Insane clown posse says...

Human: Should we look for a woman?

Assistant: It’s okay if you’re having a tough time finding what you are looking for. It’s a common question people might come up with for an argument or misunderstanding. What are you looking for, and what kind of woman would you have?

Human: Are you trying to find someone to argue

📚 ドキュメント

モデルの説明

GPT2 open instruct は、open-instruct データセットで完全に学習されました。1つのLMヘッドを部分的なrhlfアダプタとして再構築し、微妙な強化を行っています。

想定される用途と制限

このモデルは、指示モデルとプロンプトの微妙なやり取りに焦点を当てた研究に使用することを想定しています。現時点では、大幅な改良が必要かもしれません。

学習と評価データ

Train dataset size: 15000
Test dataset size: 500
Dataset({
    features: ['chosen', 'rejected'],
    num_rows: 15000
})
Dataset({
    features: ['chosen', 'rejected'],
    num_rows: 500
})

学習手順

学習ハイパーパラメータ

学習中に以下のハイパーパラメータが使用されました。

学習率: 0.0005
学習バッチサイズ: 2
評価バッチサイズ: 1
シード: 42
オプティマイザ: Adam (betas=(0.9,0.999), epsilon=1e-08)
学習率スケジューラの種類: 線形
学習率スケジューラのウォームアップステップ: 100
エポック数: 4

学習結果

学習損失	エポック	ステップ	検証損失
2.3108	1.0	7500	2.1799
2.265	2.0	15000	2.1632
2.2507	3.0	22500	2.1567
2.2519	4.0	30000	2.1534

フレームワークのバージョン

Transformers 4.31.0
Pytorch 2.0.1+cu118
Datasets 2.13.1
Tokenizers 0.13.3

📄 ライセンス

このモデルはMITライセンスの下で提供されています。

属性	詳情
モデルタイプ	ファインチューニングされたGPT2ベースのモデル
学習データ	Anthropic/hh-rlhf、hakurei/open-instruct-v1
トークナイザ	GPT2Tokenizer
ライブラリ名	transformers
評価指標	bleu