S

Sportsbert

由 microsoft 开发
SportsBERT 是一个专注于体育领域的 BERT 模型,基于体育新闻语料库训练,适用于体育相关的自然语言处理任务。
下载量 3,361
发布时间 : 3/2/2022

模型简介

SportsBERT 是基于 BERT 架构的变换器模型,专门针对体育领域训练。其训练语料包含过去四年的体育类新闻文章,涵盖多种运动项目,约800万条训练样本。模型的核心功能是预测被遮蔽的词汇(掩码语言建模任务),并可进一步微调用于文本分类、实体抽取等下游任务。

模型特点

体育领域专用
模型专门针对体育领域训练,包含更多体育相关词汇的分词器,适用于体育相关的自然语言处理任务。
大规模训练数据
训练语料包含过去四年从网络抓取的体育类新闻文章,约800万条训练样本,涵盖多种运动项目。
基于 BERT 架构
模型采用 BERT 基础版(uncased)架构,具有强大的语言理解和生成能力。

模型能力

填充掩码
文本分类
实体抽取

使用案例

体育新闻分析
体育新闻分类
对体育新闻进行分类,例如足球、篮球、网球等。
体育实体识别
识别体育新闻中的运动员、球队、比赛等实体。
体育内容生成
体育新闻摘要生成
生成体育新闻的摘要或标题。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase