P

Pythia 160m

EleutherAIによって開発
Pythia-160MはEleutherAIが開発した解釈可能性研究専用の言語モデルで、Pythiaスイートの160Mパラメータ規模バージョンであり、Transformerアーキテクチャに基づき、Pileデータセットでトレーニングされました。
ダウンロード数 163.75k
リリース時間 : 2/8/2023

モデル概要

Pythia-160Mは大規模言語モデルの解釈可能性研究のために設計された因果言語モデルで、モデルの進化過程を分析するための154のトレーニングチェックポイントを提供します。

モデル特徴

解釈可能性研究サポート
154のトレーニングチェックポイント(初期状態と中間状態を含む)を提供し、モデルの行動進化分析をサポートします
厳密なトレーニング制御
すべてのPythiaモデルは完全に同じデータ順序でトレーニングされ、実験の比較可能性を確保します
パフォーマンス最適化
Flash Attention技術を使用してトレーニング効率を向上させます

モデル能力

英語テキスト生成
言語モデル行動分析
テキスト継続生成

使用事例

学術研究
言語モデルの解釈可能性研究
マルチチェックポイント特性を利用して、モデルの学習過程における行動変化を分析します
特定の能力やバイアスの形成過程を追跡可能
モデルスケーリング法則の研究
Pythiaスイートの異なる規模のモデルを比較してパラメータ数の影響を調査します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase