Sportsbert
S
Sportsbert
microsoftによって開発
SportsBERTはスポーツ分野に特化したBERTモデルで、スポーツニュースコーパスを基に訓練され、スポーツ関連の自然言語処理タスクに適しています。
ダウンロード数 3,361
リリース時間 : 3/2/2022
モデル概要
SportsBERTはBERTアーキテクチャに基づくトランスフォーマーモデルで、スポーツ分野に特化して訓練されています。その訓練コーパスには過去4年間のスポーツ系ニュース記事が含まれ、多種のスポーツ項目をカバーし、約800万件の訓練サンプルがあります。モデルの核心機能は、遮蔽された単語を予測すること(マスク言語モデリングタスク)であり、さらにテキスト分類、エンティティ抽出などの下流タスクに微調整することができます。
モデル特徴
スポーツ分野専用
モデルはスポーツ分野に特化して訓練され、より多くのスポーツ関連単語を含む形態素解析器を備え、スポーツ関連の自然言語処理タスクに適しています。
大規模な訓練データ
訓練コーパスには過去4年間にネットから収集されたスポーツ系ニュース記事が含まれ、約800万件の訓練サンプルがあり、多種のスポーツ項目をカバーしています。
BERTアーキテクチャに基づく
モデルはBERTベーシック版(uncased)アーキテクチャを採用し、強力な言語理解と生成能力を持っています。
モデル能力
マスク埋め
テキスト分類
エンティティ抽出
使用事例
スポーツニュース分析
スポーツニュース分類
スポーツニュースを分類します。例えば、サッカー、バスケットボール、テニスなど。
スポーツエンティティ識別
スポーツニュース中の選手、チーム、試合などのエンティティを識別します。
スポーツコンテンツ生成
スポーツニュース要約生成
スポーツニュースの要約またはタイトルを生成します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98