P

Pythia 1b

由EleutherAI開發
Pythia-1B是EleutherAI開發的可解釋性研究專用語言模型,屬於Pythia套件中的10億參數規模版本,基於The Pile數據集訓練。
下載量 79.69k
發布時間 : 3/10/2023

模型概述

Pythia系列模型專為語言模型行為研究設計,提供完全透明的訓練過程和154箇中間檢查點,支持科學實驗的受控環境。

模型特點

可解釋性研究支持
提供154個訓練檢查點(包括對數間隔和均勻間隔),支持模型行為演變研究
完全透明訓練
所有模型使用相同數據和訓練順序,確保實驗可比性
去重對比版本
提供原始Pile數據集和去重版本訓練的成對模型

模型能力

英語文本生成
語言模型行為分析
可解釋性研究

使用案例

學術研究
模型行為分析
研究語言模型在不同訓練階段的性能變化
提供154個檢查點支持縱向研究
去重數據影響研究
對比原始數據與去重數據訓練的模型表現差異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase