E

Eleuther Pythia6.9b Hh Sft

lomahonyによって開発
Pythia-6.9bベースモデルを使用し、Anthropicのhh-rlhfデータセットで教師ありファインチューニングされた因果言語モデル
ダウンロード数 58
リリース時間 : 8/7/2023

モデル概要

これは69億パラメータ規模の因果言語モデルで、RLHF(人間のフィードバックによる強化学習)でファインチューニングされており、対話生成やテキスト補完タスクに適しています

モデル特徴

RLHFファインチューニング
Anthropicのhh-rlhfデータセットを使用した教師ありファインチューニングにより、モデルの人間の嗜好への適合能力が向上しました
大規模パラメータ
69億パラメータ規模が強力な言語理解と生成能力を提供します
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商業用途や研究用途が可能です

モデル能力

テキスト生成
対話生成
テキスト補完
指示追従

使用事例

対話システム
インテリジェントアシスタント
人間の指示を理解し応答できる対話アシスタントの構築
RLHFファインチューニングにより、より人間の嗜好に合った返答が生成可能
コンテンツ作成
クリエイティブライティング支援
作家のクリエイティブライティングやコンテンツ生成を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase