Sportsbert
模型简介
SportsBERT 是基于 BERT 架构的变换器模型,专门针对体育领域训练。其训练语料包含过去四年的体育类新闻文章,涵盖多种运动项目,约800万条训练样本。模型的核心功能是预测被遮蔽的词汇(掩码语言建模任务),并可进一步微调用于文本分类、实体抽取等下游任务。
模型特点
体育领域专用
模型专门针对体育领域训练,包含更多体育相关词汇的分词器,适用于体育相关的自然语言处理任务。
大规模训练数据
训练语料包含过去四年从网络抓取的体育类新闻文章,约800万条训练样本,涵盖多种运动项目。
基于 BERT 架构
模型采用 BERT 基础版(uncased)架构,具有强大的语言理解和生成能力。
模型能力
填充掩码
文本分类
实体抽取
使用案例
体育新闻分析
体育新闻分类
对体育新闻进行分类,例如足球、篮球、网球等。
体育实体识别
识别体育新闻中的运动员、球队、比赛等实体。
体育内容生成
体育新闻摘要生成
生成体育新闻的摘要或标题。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98