G

Gpt2 Open Instruct V1 Anthropic Hh Rlhf

jtatmanによって開発
GPT2-open-instructをベースに、Anthropic/hh-rlhfデータセットで微調整された対話モデルで、対話シーンのプロンプトに対する応答に長けています。
ダウンロード数 125
リリース時間 : 7/22/2023

モデル概要

このモデルは、vicgalle/gpt2-open-instruct-v1をベースに、Anthropic/hh-rlhfデータセットのサブセットで微調整されたバージョンで、主に対話シーンの指令応答に使用されます。

モデル特徴

対話シーン最適化
「Human:」と「Assistant:」の対話形式に特化して最適化されています。
短いテキスト生成の優位性
短いテキストの返答シーンでより良い性能を発揮します。
RLHF適合
一部のRLHFアダプターを通じて言語モデルのヘッドを再構築しました。

モデル能力

対話生成
指令応答
短いテキスト生成

使用事例

対話システム
対話応答生成
ユーザーの入力に基づいて対話応答を生成します。
評価セットで2.1534の損失値を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase