T

Tucano 2b4

由TucanoBR開發
Tucano-2b4是一個專門針對葡萄牙語進行原生預訓練的大規模語言模型,基於變換器架構,在2000億標記的GigaVerbo數據集上訓練。
下載量 1,478
發布時間 : 10/16/2024

模型概述

Tucano系列模型專注於葡萄牙語文本生成任務,支持4096標記的長上下文處理,適用於葡萄牙語相關的研究和開發。

模型特點

原生葡萄牙語預訓練
專門針對葡萄牙語進行優化訓練,能更好地處理葡萄牙語相關任務。
大規模數據集訓練
在包含2000億標記的GigaVerbo數據集上訓練,學習到豐富的語言知識。
長上下文處理能力
支持4096個標記的上下文長度,能處理更復雜的文本任務。

模型能力

葡萄牙語文本生成
長文本處理
語言模型研究

使用案例

語言研究
葡萄牙語語言模型研究
作為葡萄牙語語言模型研究的基礎模型
提供可控的實驗環境用於對比研究
文本生成
葡萄牙語內容創作
生成葡萄牙語文章、故事等內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase