P

Pythia 12b

由EleutherAI開發
Pythia-12B是EleutherAI開發的可擴展語言模型套件中的最大模型,擁有120億參數,專為促進大語言模型科學研究而設計
下載量 9,938
發布時間 : 2/28/2023

模型概述

Pythia-12B是基於Transformer架構的大規模語言模型,是Pythia套件中最大的模型。它主要用於語言模型行為和功能的研究,特別是在可解釋性研究方面。

模型特點

科學研究的可解釋性
專為促進大語言模型科學研究而設計,特別關注模型行為的可解釋性
完整訓練檢查點
提供154個訓練檢查點,包括初始狀態和密集間隔的中間狀態,便於研究訓練動態
標準化訓練
所有Pythia模型在完全相同的數據和順序下訓練,便於對比研究

模型能力

英語文本生成
語言模型行為研究
可解釋性分析

使用案例

科學研究
語言模型行為研究
研究大規模語言模型在不同訓練階段的行為變化
提供154個檢查點便於分析訓練動態
可解釋性研究
分析模型內部機制和決策過程
標準化的模型設計便於對比實驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase