ukr-roberta-base开源模型 - 免费部署助力乌克兰语自然语言处理任务

Ukr Roberta Base

由 youscan 开发

基于乌克兰语大规模语料训练的RoBERTa基础模型，适用于乌克兰语自然语言处理任务

下载量 3,702

发布时间 : 3/2/2022

模型简介

这是一个基于乌克兰语维基百科、OSCAR去重数据集和社交媒体文本训练的RoBERTa基础模型，采用与roberta-base-cased相同的架构，专门针对乌克兰语优化

大规模乌克兰语预训练

使用超过33亿字符的乌克兰语语料进行预训练，包含维基百科、OSCAR去重数据集和社交媒体文本

标准RoBERTa架构

采用与roberta-base-cased相同的12层Transformer架构，确保与其他RoBERTa模型的兼容性

高效训练

使用4块V100显卡在85小时内完成训练，训练效率高

文本理解

文本分类

命名实体识别

问答系统

文本生成

文本分析

乌克兰语情感分析

分析乌克兰语社交媒体文本的情感倾向

乌克兰语新闻分类

对乌克兰语新闻文章进行自动分类

语言理解

乌克兰语问答系统

构建基于乌克兰语的知识问答系统