P

Pythia 12b

Developed by EleutherAI
Pythia-12B是EleutherAI开发的可扩展语言模型套件中的最大模型,拥有120亿参数,专为促进大语言模型科学研究而设计
Downloads 9,938
Release Time : 2/28/2023

Model Overview

Pythia-12B是基于Transformer架构的大规模语言模型,是Pythia套件中最大的模型。它主要用于语言模型行为和功能的研究,特别是在可解释性研究方面。

Model Features

科学研究的可解释性
专为促进大语言模型科学研究而设计,特别关注模型行为的可解释性
完整训练检查点
提供154个训练检查点,包括初始状态和密集间隔的中间状态,便于研究训练动态
标准化训练
所有Pythia模型在完全相同的数据和顺序下训练,便于对比研究

Model Capabilities

英语文本生成
语言模型行为研究
可解释性分析

Use Cases

科学研究
语言模型行为研究
研究大规模语言模型在不同训练阶段的行为变化
提供154个检查点便于分析训练动态
可解释性研究
分析模型内部机制和决策过程
标准化的模型设计便于对比实验
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase