B

Byt5 Small English

由 hmbyt5 开发
历史多语言与单语言ByT5基础模型,当前版本专注于英语文本处理。
下载量 30
发布时间 : 4/8/2023

模型简介

基于ByT5架构的基础语言模型,专门针对英语文本进行预训练,适用于多种自然语言处理任务。

模型特点

历史文本优化
基于大英图书馆书籍语料库训练,特别适合处理历史文献和书籍文本。
多任务适应
在命名实体识别等下游任务上表现优异,平均F1分数达85以上。
高效训练
使用单个v3-8 TPU进行预训练,训练效率高。

模型能力

英语文本理解
命名实体识别
历史文献处理

使用案例

学术研究
历史文献分析
对大英图书馆历史书籍进行命名实体识别和信息提取
在英语AjMC数据集上F1分数达85.65
信息提取
多语言实体识别
处理英语、德语、法语等多种语言的命名实体识别任务
在德语AjMC上F1分数87.27,法语AjMC上84.44
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase