T

Tinystories Gpt2 3M

由 calum 开发
这是一个小型GPT-2模型,在TinyStories V2数据集上预训练,具有3M可训练参数,表现出良好的文本生成连贯性。
下载量 637
发布时间 : 10/9/2023

模型简介

该模型是基于GPT-2架构的小型语言模型,专门为研究目的设计,在有限的词汇量下展现出令人惊讶的文本生成能力。

模型特点

小型高效
仅3M参数的小型模型,在有限资源下表现出色
连贯生成
在给定其大小的情况下,表现出惊人的文本连贯性
研究友好
采用广泛支持的GPT-2架构,便于研究实验

模型能力

英文文本生成
短篇故事创作
受限词汇量下的连贯表达

使用案例

教育研究
小型语言模型研究
用于研究有限参数下语言模型的性能表现
可观察到小型模型在特定领域的生成能力
文本生成
简单故事创作
生成适合儿童阅读的简短故事
在训练词汇范围内可生成连贯故事
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase