I

Icebert

由mideind開發
基於RoBERTa-base架構訓練的冰島語掩碼語言模型,使用16GB冰島語文本數據訓練
下載量 1,203
發布時間 : 3/2/2022

模型概述

專為冰島語設計的預訓練語言模型,適用於各種自然語言處理任務

模型特點

大規模冰島語訓練數據
整合了7個不同來源的冰島語語料庫,總計15.8GB文本數據
多領域覆蓋
訓練數據包含新聞、醫學文獻、學術論文、古典文學等多種文本類型
下游任務表現優異
在詞性標註、命名實體識別等任務中達到最先進水平

模型能力

文本補全
語言理解
上下文預測

使用案例

自然語言處理
詞性標註
自動識別冰島語文本中單詞的詞性
達到最先進水平
命名實體識別
識別冰島語文本中的人名、地名等實體
達到最先進水平
文本分析
語法錯誤檢測
檢測冰島語文本中的語法錯誤
表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase