🚀 センチメント分析用のスウェーデン語BERTモデル
Recorded Future は AI Sweden と協力して、スウェーデン語のセンチメント分析用の2つの言語モデルをリリースしました。これらの2つのモデルは KB/bert-base-swedish-cased モデルに基づいており、マルチラベルのセンチメント分析タスクを解くためにファインチューニングされています。
これらのモデルは、恐怖と暴力のセンチメントについてファインチューニングされています。モデルは、それぞれのインデックスで「Negative」(否定的)、「Weak sentiment」(弱いセンチメント)、「Strong Sentiment」(強いセンチメント)のラベルに対応する3つの浮動小数点数を出力します。
これらのモデルは、様々なインターネットソースやフォーラムから収集された会話中心のスウェーデン語データで学習されています。
これらのモデルはスウェーデン語データのみで学習されており、スウェーデン語の入力テキストの推論のみをサポートしています。非スウェーデン語の入力に対するモデルの推論指標は定義されておらず、これらの入力はドメイン外データと見なされます。
現在のモデルは、Transformersバージョン >= 4.3.3 とTorchバージョン1.8.0でサポートされており、古いバージョンとの互換性は検証されていません。
🚀 クイックスタート
これらのモデルを使用するには、以下の手順に従ってください。
✨ 主な機能
- スウェーデン語のセンチメント分析を行うことができます。
- 恐怖と暴力のセンチメントについてファインチューニングされています。
- マルチラベルのセンチメント分析タスクを解くことができます。
📦 インストール
これらのモデルは、Transformersライブラリからインポートすることができます。
Swedish-Sentiment-Fear
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
classifier_fear = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
Swedish-Sentiment-Violence
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
classifier_violence = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
💻 使用例
基本的な使用法
モデルとトークナイザーが初期化されたら、モデルを推論に使用することができます。
Swedish-Sentiment-Fear
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
classifier_fear = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
input_text = "Jag är så rädd för mörker."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = classifier_fear(**inputs)
logits = outputs.logits
Swedish-Sentiment-Violence
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
classifier_violence = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
input_text = "Han slog honom hårt."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = classifier_violence(**inputs)
logits = outputs.logits
📚 ドキュメント
センチメントの定義
強いセンチメントには以下が含まれますが、これらに限定されません。
以下のようなテキスト:
弱いセンチメントには以下が含まれますが、これらに限定されません。
以下のようなテキスト:
検証指標
学習中、モデルは以下の分類ブレークポイントで検証指標を最大化しました。
分類ブレークポイント |
F値 |
適合率 |
再現率 |
0.45 |
0.8754 |
0.8618 |
0.8895 |
Swedish-Sentiment-Violence
センチメントの定義
強いセンチメントには以下が含まれますが、これらに限定されません。
以下のようなテキスト:
弱いセンチメントには以下が含まれますが、これらに限定されません。
以下のようなテキスト:
- 強いセンチメントに該当しない一般的な暴力的な記述を含む
検証指標
学習中、モデルは以下の分類ブレークポイントで検証指標を最大化しました。
分類ブレークポイント |
F値 |
適合率 |
再現率 |
0.35 |
0.7677 |
0.7456 |
0.791 |
📄 ライセンス
このプロジェクトはMITライセンスの下で公開されています。