P

Pythia 12b

EleutherAIによって開発
Pythia-12BはEleutherAIが開発したスケーラブルな言語モデルスイートの中で最大のモデルで、120億のパラメータを持ち、大規模言語モデルの科学研究を促進するために設計されています
ダウンロード数 9,938
リリース時間 : 2/28/2023

モデル概要

Pythia-12BはTransformerアーキテクチャに基づく大規模言語モデルで、Pythiaスイートの中で最大のモデルです。主に言語モデルの挙動と機能の研究、特に解釈可能性研究に使用されます。

モデル特徴

科学研究のための解釈可能性
大規模言語モデルの科学研究を促進するために設計されており、特にモデル挙動の解釈可能性に焦点を当てています
完全なトレーニングチェックポイント
初期状態と密な間隔の中間状態を含む154のトレーニングチェックポイントを提供し、トレーニングダイナミクスの研究を容易にします
標準化されたトレーニング
すべてのPythiaモデルは完全に同じデータと順序でトレーニングされており、比較研究が容易です

モデル能力

英語テキスト生成
言語モデル挙動研究
解釈可能性分析

使用事例

科学研究
言語モデル挙動研究
大規模言語モデルの異なるトレーニング段階における挙動変化を研究
154のチェックポイントを提供し、トレーニングダイナミクスの分析を容易にします
解釈可能性研究
モデルの内部メカニズムと意思決定プロセスを分析
標準化されたモデル設計により、比較実験が容易です
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase