eleuther - pythia6.9b - hh - sftオープンソース言語モデル - 高品質な対話や質問応答などのアプリケーションをサポート

ホーム

Eleuther Pythia6.9b Hh Sft

lomahonyによって開発

Pythia-6.9bベースモデルを使用し、Anthropicのhh-rlhfデータセットで教師ありファインチューニングされた因果言語モデル

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #人間の嗜好への適合 #RLHFファインチューニング #対話最適化

ダウンロード数 58

リリース時間 : 8/7/2023

モデル概要

これは69億パラメータ規模の因果言語モデルで、RLHF（人間のフィードバックによる強化学習）でファインチューニングされており、対話生成やテキスト補完タスクに適しています

モデル特徴

RLHFファインチューニング

Anthropicのhh-rlhfデータセットを使用した教師ありファインチューニングにより、モデルの人間の嗜好への適合能力が向上しました

大規模パラメータ

69億パラメータ規模が強力な言語理解と生成能力を提供します

オープンソースライセンス

Apache-2.0ライセンスを採用しており、商業用途や研究用途が可能です

モデル能力

テキスト生成

対話生成

テキスト補完

指示追従

使用事例

対話システム

インテリジェントアシスタント

人間の指示を理解し応答できる対話アシスタントの構築

RLHFファインチューニングにより、より人間の嗜好に合った返答が生成可能

コンテンツ作成

クリエイティブライティング支援

作家のクリエイティブライティングやコンテンツ生成を支援

属性	详情
モデルタイプ	Causal-LM
訓練データ	Anthropic/hh-rlhf
ライセンス	apache-2.0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Eleuther Pythia6.9b Hh Sft

モデル概要

モデル特徴

モデル能力

使用事例

🚀 [Pythia-6.9b のファインチューニングモデル]

🚀 クイックスタート

📄 ライセンス