B

Bertino

由indigo-ai開發
基於大規模意大利語語料庫預訓練的輕量級DistilBERT模型,適用於多種自然語言處理任務。
下載量 64
發布時間 : 3/2/2022

模型概述

BERTino是由indigo.ai開發的意大利語預訓練語言模型,採用DistilBERT架構,具有任務無關性,可針對各類下游任務進行微調。

模型特點

輕量高效
採用DistilBERT架構,相比標準BERT模型體積更小、速度更快,同時保持較高性能。
大規模預訓練
基於整合Paisa和ItWaC兩大語料庫的1400萬句子(12GB文本)進行預訓練。
多任務適配
經過驗證可應用於詞性標註、命名實體識別和句子分類等多種下游任務。

模型能力

文本分類
命名實體識別
詞性標註
語義理解

使用案例

自然語言處理
詞性標註
在Italian ISDT數據集上實現0.9801的F1分數
微調耗時9分4秒,評估僅需3秒
命名實體識別
在Italian WikiNER數據集上的表現
F1分數0.9038,比教師模型快近50%的微調速度
句子分類
多類別分類任務應用
F1分數0.7788,評估耗時僅6秒
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase