G

Gpt2 1558M Final4 Hf

Developed by karpathy
在FineWeb-EDU数据集上训练的GPT-2模型,展现自然语言处理能力
Downloads 1,073
Release Time : 7/12/2024

Model Overview

基于llm.c框架训练的GPT-2变体,专注于教育领域文本处理

Model Features

长时训练
目前训练时长最长的GPT-2模型之一(330K步)
教育领域优化
使用FineWeb-EDU数据集训练,适合教育相关内容处理
高效实现
基于llm.c框架的高效训练实现

Model Capabilities

文本生成
语言建模
文本理解

Use Cases

教育技术
教育内容生成
自动生成教育相关文本材料
学习辅助
帮助学生理解和生成教育相关内容
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase