A

Albertina 100m Portuguese Ptbr Encoder

由PORTULAN開發
Albertina 100M PTBR是一個面向巴西葡萄牙語的基礎大語言模型,屬於BERT家族的編碼器,基於Transformer神經網絡架構,並在DeBERTa模型基礎上開發。
下載量 131
發布時間 : 5/25/2023

模型概述

該模型是針對巴西葡萄牙語的基礎大語言模型,具有1億參數,採用MIT許可證分發,可用於掩碼語言建模等任務。

模型特點

巴西葡萄牙語優化
專門針對巴西葡萄牙語進行訓練和優化,提供更準確的語言理解能力。
基於DeBERTa架構
在DeBERTa模型基礎上開發,結合了Transformer架構的優勢,具有更強的性能表現。
開源許可證
採用MIT許可證分發,允許自由使用和修改。

模型能力

掩碼語言建模
文本理解
下游任務微調

使用案例

自然語言處理
語義相似度分析
可用於分析兩段文本的語義相似度
在STS-B任務上達到0.8501皮爾遜係數
文本蘊含識別
判斷一段文本是否蘊含另一段文本的含義
在RTE任務上達到0.6462準確率
文本處理
自動補全
預測被掩碼遮蓋的詞語
示例中準確預測了'costumes'作為最佳補全詞
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase