G

Gpt2 1558M Final4 Hf

由karpathy開發
在FineWeb-EDU數據集上訓練的GPT-2模型,展現自然語言處理能力
下載量 1,073
發布時間 : 7/12/2024

模型概述

基於llm.c框架訓練的GPT-2變體,專注於教育領域文本處理

模型特點

長時訓練
目前訓練時長最長的GPT-2模型之一(330K步)
教育領域優化
使用FineWeb-EDU數據集訓練,適合教育相關內容處理
高效實現
基於llm.c框架的高效訓練實現

模型能力

文本生成
語言建模
文本理解

使用案例

教育技術
教育內容生成
自動生成教育相關文本材料
學習輔助
幫助學生理解和生成教育相關內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase