P

Pythia 160m

由EleutherAI開發
Pythia-160M是EleutherAI開發的可解釋性研究專用語言模型,屬於Pythia套件中的160M參數規模版本,基於Transformer架構,訓練於Pile數據集。
下載量 163.75k
發布時間 : 2/8/2023

模型概述

Pythia-160M是專為大型語言模型可解釋性研究設計的因果語言模型,提供154個訓練檢查點便於分析模型演變過程。

模型特點

可解釋性研究支持
提供154個訓練檢查點(包括初始和中間狀態),支持模型行為演變分析
嚴格訓練控制
所有Pythia模型在完全相同的數據順序下訓練,確保實驗可比性
性能優化
使用Flash Attention技術提升訓練效率

模型能力

英語文本生成
語言模型行為分析
文本續寫

使用案例

學術研究
語言模型可解釋性研究
利用多檢查點特性分析模型學習過程中的行為變化
可追蹤特定能力或偏見的形成過程
模型縮放規律研究
通過對比Pythia套件不同規模模型探究參數量的影響
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase