R

Roberta El News

由cvcio開發
基於希臘語新聞數據預訓練的RoBERTa模型,專注於掩碼語言建模任務
下載量 51
發布時間 : 3/2/2022

模型概述

這是一個基於希臘語新聞數據預訓練的RoBERTa模型,採用掩碼語言建模(MLM)目標訓練,適用於希臘語文本處理任務。

模型特點

希臘語新聞數據訓練
使用2016-2021年間800萬篇希臘新聞文章(約1.6億句)進行預訓練
保留變音符號
模型處理希臘語文本時保留所有變音符號
不區分大小寫
模型對文本大小寫不敏感
高效分詞
使用BPE分詞器,詞彙量50,265

模型能力

希臘語文本理解
掩碼語言預測
命名實體識別(經微調)

使用案例

新聞分析
政治新聞分析
分析希臘政治新聞中的關鍵信息
在示例中成功預測了政治報道中的關鍵詞語
文本補全
新聞文本補全
預測新聞文本中被掩碼的詞語
在示例中準確預測了'公開'、'發佈'等詞語
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase