T

Tucano 2b4

由 TucanoBR 开发
Tucano-2b4是一个专门针对葡萄牙语进行原生预训练的大规模语言模型,基于变换器架构,在2000亿标记的GigaVerbo数据集上训练。
下载量 1,478
发布时间 : 10/16/2024

模型简介

Tucano系列模型专注于葡萄牙语文本生成任务,支持4096标记的长上下文处理,适用于葡萄牙语相关的研究和开发。

模型特点

原生葡萄牙语预训练
专门针对葡萄牙语进行优化训练,能更好地处理葡萄牙语相关任务。
大规模数据集训练
在包含2000亿标记的GigaVerbo数据集上训练,学习到丰富的语言知识。
长上下文处理能力
支持4096个标记的上下文长度,能处理更复杂的文本任务。

模型能力

葡萄牙语文本生成
长文本处理
语言模型研究

使用案例

语言研究
葡萄牙语语言模型研究
作为葡萄牙语语言模型研究的基础模型
提供可控的实验环境用于对比研究
文本生成
葡萄牙语内容创作
生成葡萄牙语文章、故事等内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase