S

Sportsbert

由microsoft開發
SportsBERT 是一個專注於體育領域的 BERT 模型,基於體育新聞語料庫訓練,適用於體育相關的自然語言處理任務。
下載量 3,361
發布時間 : 3/2/2022

模型概述

SportsBERT 是基於 BERT 架構的變換器模型,專門針對體育領域訓練。其訓練語料包含過去四年的體育類新聞文章,涵蓋多種運動項目,約800萬條訓練樣本。模型的核心功能是預測被遮蔽的詞彙(掩碼語言建模任務),並可進一步微調用於文本分類、實體抽取等下游任務。

模型特點

體育領域專用
模型專門針對體育領域訓練,包含更多體育相關詞彙的分詞器,適用於體育相關的自然語言處理任務。
大規模訓練數據
訓練語料包含過去四年從網絡抓取的體育類新聞文章,約800萬條訓練樣本,涵蓋多種運動項目。
基於 BERT 架構
模型採用 BERT 基礎版(uncased)架構,具有強大的語言理解和生成能力。

模型能力

填充掩碼
文本分類
實體抽取

使用案例

體育新聞分析
體育新聞分類
對體育新聞進行分類,例如足球、籃球、網球等。
體育實體識別
識別體育新聞中的運動員、球隊、比賽等實體。
體育內容生成
體育新聞摘要生成
生成體育新聞的摘要或標題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase