# 大规模语料库

Ukr Roberta Base
基于乌克兰语大规模语料训练的RoBERTa基础模型,适用于乌克兰语自然语言处理任务
大型语言模型 其他
U
youscan
3,702
23
Procbert
ProcBERT是专为流程文本优化的预训练语言模型,基于大规模流程文本语料库(包含生物医学文献、化学专利和烹饪食谱)进行预训练,在下游任务中展现出卓越性能。
大型语言模型 Transformers 英语
P
fbaigt
13
1
FERNET C5
FERNET-C5是一个基于捷克语的单语BERT基础模型,预训练数据来自93GB的捷克语大规模清洁爬取语料库(C5)。
大型语言模型 Transformers 其他
F
fav-kky
219
7
Wav2vec2 Base Nl Voxpopuli
基于VoxPopuli语料库荷兰语子集预训练的Wav2Vec2基础模型,适用于荷兰语语音识别任务。
语音识别 Transformers 其他
W
facebook
31
0
Wav2vec2 Large Es Voxpopuli
基于VoxPopuli语料库西班牙语子集训练的大型语音预训练模型,适用于西班牙语语音识别任务
语音识别 西班牙语
W
facebook
117.04k
1
Mt5 Base
Apache-2.0
mT5是T5模型的多语言变体,基于覆盖101种语言的mC4语料库预训练,适用于多语言文本处理任务。
大型语言模型 支持多种语言
M
google
118.49k
229
Wav2vec2 FR 2.6K Base
Apache-2.0
基于2.6千小时法语语音训练的基础wav2vec2模型,不含自发语音数据
语音识别 Transformers 法语
W
LeBenchmark
41
0
Wav2vec2 FR 3K Large
Apache-2.0
基于2.9K小时法语语音训练的大型wav2vec2模型,支持自发语音、朗读语音和广播语音处理
语音识别 法语
W
LeBenchmark
948
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase