G

Gpt2 1558M Final4 Hf

由 karpathy 开发
在FineWeb-EDU数据集上训练的GPT-2模型,展现自然语言处理能力
下载量 1,073
发布时间 : 7/12/2024

模型简介

基于llm.c框架训练的GPT-2变体,专注于教育领域文本处理

模型特点

长时训练
目前训练时长最长的GPT-2模型之一(330K步)
教育领域优化
使用FineWeb-EDU数据集训练,适合教育相关内容处理
高效实现
基于llm.c框架的高效训练实现

模型能力

文本生成
语言建模
文本理解

使用案例

教育技术
教育内容生成
自动生成教育相关文本材料
学习辅助
帮助学生理解和生成教育相关内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase