🚀 COVID-Twitter-BERT v2 MNLI
このモデルは、ラベル付きデータが不足しているため、特定のタスクでCT - BERTをファインチューニングできない場合に使用するゼロショット分類器を提供します。
🚀 クイックスタート
このモデルは、特定のタスクでCT - BERTをファインチューニングできない場合に役立つゼロショット分類器です。以下に使い方の基本的な流れを説明します。
✨ 主な機能
- ラベル付きデータが不足している場合でも、ゼロショットでのテキスト分類が可能です。
- MNLIモデルを利用した巧妙な分類手法を採用しています。
📦 インストール
このモデルを使用するには、transformers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers
💻 使用例
基本的な使用法
from transformers import pipeline
classifier = pipeline("zero-shot-classification", model="digitalepidemiologylab/covid-twitter-bert-v2-mnli")
高度な使用法
sequence_to_classify = 'To stop the pandemic it is important that everyone turns up for their shots.'
candidate_labels = ['health', 'sport', 'vaccine', 'guns']
hypothesis_template = 'This example is {}.'
classifier(sequence_to_classify, candidate_labels, hypothesis_template=hypothesis_template, multi_class=True)
📚 ドキュメント
モデルの説明
このモデルは、特定のタスクでCT - BERTをファインチューニングできない場合に使用するゼロショット分類器を提供します。この手法はYin et al.に基づいており、事前学習されたMNLIモデルをゼロショットシーケンス分類器として使用する非常に賢い方法を記述しています。このモデルはすでに40万の一般的な論理タスクでファインチューニングされています。分類タスクを質問として再定式化することで、ゼロショット分類器として使用できます。
例えば、COVID関連のツイートをワクチン関連と非ワクチン関連に分類したい場合、通常は数百の事前アノテーション付きのツイートを収集し、2つのクラスに分けてモデルをファインチューニングします。しかし、ゼロショットMNLI分類器を使用すると、質問を「このテキストはワクチンに関するものです」と再定式化し、トレーニングなしで直接推論に使用できます。
モデルに関する詳細な情報は、GitHubページを参照してください。
使用上の注意
質問の定式化方法によって、わずかに異なる結果が得られる場合があります。トレーニングセットを収集してファインチューニングすることで、より高い精度が得られる可能性があります。
🔧 技術詳細
このモデルは、40万件の大規模なMNLIタスクでファインチューニングされています。
📄 ライセンス
このモデルはMITライセンスの下で提供されています。
参考文献
@article{muller2020covid,
title={COVID-Twitter-BERT: A Natural Language Processing Model to Analyse COVID-19 Content on Twitter},
author={M{\"u}ller, Martin and Salath{\'e}, Marcel and Kummervold, Per E},
journal={arXiv preprint arXiv:2005.07503},
year={2020}
}
または
Martin Müller, Marcel Salathé, and Per E. Kummervold.
COVID-Twitter-BERT: A Natural Language Processing Model to Analyse COVID-19 Content on Twitter.
arXiv preprint arXiv:2005.07503 (2020).
情報テーブル
属性 |
詳情 |
モデルタイプ |
ゼロショット分類器 |
トレーニングデータ |
MNLI |
ライセンス |
MIT |
パイプラインタグ |
ゼロショット分類 |
重要提示
⚠️ 重要提示
質問の定式化方法によって、わずかに異なる結果が得られる場合があります。トレーニングセットを収集してファインチューニングすることで、より高い精度が得られる可能性があります。
使用建议
💡 使用アドバイス
このモデルを使用する際には、質問の定式化に注意してください。また、可能であればトレーニングセットを収集してファインチューニングすることをおすすめします。