R

Roberta El News

由 cvcio 开发
基于希腊语新闻数据预训练的RoBERTa模型,专注于掩码语言建模任务
下载量 51
发布时间 : 3/2/2022

模型简介

这是一个基于希腊语新闻数据预训练的RoBERTa模型,采用掩码语言建模(MLM)目标训练,适用于希腊语文本处理任务。

模型特点

希腊语新闻数据训练
使用2016-2021年间800万篇希腊新闻文章(约1.6亿句)进行预训练
保留变音符号
模型处理希腊语文本时保留所有变音符号
不区分大小写
模型对文本大小写不敏感
高效分词
使用BPE分词器,词汇量50,265

模型能力

希腊语文本理解
掩码语言预测
命名实体识别(经微调)

使用案例

新闻分析
政治新闻分析
分析希腊政治新闻中的关键信息
在示例中成功预测了政治报道中的关键词语
文本补全
新闻文本补全
预测新闻文本中被掩码的词语
在示例中准确预测了'公开'、'发布'等词语
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase