P

Pythia 1b Deduped

EleutherAIによって開発
Pythia-10億重複排除版はEleutherAIが開発した解釈可能性研究専用の言語モデルで、重複排除処理済みPileデータセットで訓練され、Transformerアーキテクチャを採用、パラメータ規模10億
ダウンロード数 19.89k
リリース時間 : 2/14/2023

モデル概要

このモデルはPythiaスケーラブルスイートの一部で、大規模言語モデルの行動研究のために設計され、科学的分析を支援するために154の訓練チェックポイントを提供

モデル特徴

完全な訓練軌跡
154のチェックポイント(初期step0と密集ログ間隔チェックポイントを含む)を提供し、訓練動態研究を支援
データ重複排除処理
グローバルに重複排除されたPileデータセットを使用して訓練し、データ重複がモデルに与える影響を低減
科学的実験設計
厳密に制御された訓練プロセスとハイパーパラメータにより、スイート内の他規模モデルとの比較研究が容易

モデル能力

英語テキスト生成
言語モデル行動分析
解釈可能性研究

使用事例

学術研究
モデル行動分析
異なる訓練段階における言語モデルの性能変化を研究
定量評価指標(例:LAMBADA正解率)を提供
バイアス研究
モデル生成テキスト中の社会的バイアスを分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase