P

Pythia 6.9b

由EleutherAI開發
Pythia-6.9B是EleutherAI開發的大規模語言模型,屬於Pythia可擴展套件的一部分,專為促進可解釋性研究而設計。
下載量 46.72k
發布時間 : 2/14/2023

模型概述

Pythia-6.9B是一個基於Transformer的因果語言模型,在The Pile數據集上訓練,主要用於科學研究,特別是大語言模型行為和功能的研究。

模型特點

科學研究的可解釋性
專為促進大語言模型行為、功能和侷限性的科學研究而設計
完整訓練檢查點
提供154個訓練檢查點,包括初始和中間狀態,便於研究模型演變過程
數據一致性
所有模型使用完全相同的數據和訓練順序,確保實驗可比性

模型能力

英語文本生成
語言模型研究
模型行為分析

使用案例

科學研究
語言模型可解釋性研究
研究大語言模型內部工作機制和行為模式
模型訓練動態分析
通過多個檢查點研究模型訓練過程中的變化
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase