🚀 クイックスタート
このモデルは、ModernBERT-large を GoEmotions データセットでマルチラベル分類のためにファインチューニングしたものです。テキスト内の感情状態を予測し、合計28のラベルがあります。各入力テキストは1つ以上のラベルを持つことができ、これがマルチラベル分類の特徴です。
こちら で試すことができます。

✨ 主な機能
- 英語のテキストに対する感情分類を行います。
- マルチラベル分類が可能で、各テキストに複数の感情ラベルを付与できます。
📦 インストール
このモデルを使用するには、Hugging Face Transformers ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers torch
💻 使用例
基本的な使用法
from transformers import pipeline
import torch
classifier = pipeline(
"text-classification",
model="cirimus/modernbert-large-go-emotions",
top_k=5
)
text = "I am so happy and excited about this opportunity!"
predictions = classifier(text)
sorted_preds = sorted(predictions[0], key=lambda x: x['score'], reverse=True)
top_5 = sorted_preds[:5]
print("\nTop 5 emotions detected:")
for pred in top_5:
print(f"\t{pred['label']:10s} : {pred['score']:.3f}")
📚 ドキュメント
モデルの詳細
モデルの作成方法
このモデルは、以下のハイパーパラメータを使用して3エポックでファインチューニングされました。
- 学習率:
2e-5
- バッチサイズ: 16
- 重み減衰:
0.01
- オプティマイザ: AdamW
- 評価指標: 精度、再現率、F1スコア(加重平均)、正解率
データセット
GoEmotions データセットは、Redditのコメントから派生したマルチラベル感情分類データセットです。58,000のサンプルと28の感情ラベル(例: 賞賛、喜び、怒りなど)が含まれており、マルチラベル分類のためにアノテーションされています。
評価結果
このモデルは、GoEmotionsデータセットのテストデータで評価されました。予測を二値化するための閾値は 0.5
を使用しました。
標準的な結果:
ラベル |
正解率 |
精度 |
再現率 |
F1スコア |
マシューズ相関係数 |
サポート数 |
閾値 |
マクロ平均 |
0.971 |
0.611 |
0.410 |
0.472 |
0.475 |
5427 |
0.5 |
賞賛 |
0.946 |
0.739 |
0.653 |
0.693 |
0.666 |
504 |
0.5 |
喜び |
0.982 |
0.817 |
0.814 |
0.816 |
0.807 |
264 |
0.5 |
怒り |
0.968 |
0.671 |
0.237 |
0.351 |
0.387 |
198 |
0.5 |
苛立ち |
0.938 |
0.449 |
0.191 |
0.268 |
0.265 |
320 |
0.5 |
承認 |
0.940 |
0.564 |
0.302 |
0.393 |
0.384 |
351 |
0.5 |
思いやり |
0.977 |
0.581 |
0.319 |
0.411 |
0.420 |
135 |
0.5 |
混乱 |
0.973 |
0.553 |
0.307 |
0.395 |
0.400 |
153 |
0.5 |
好奇心 |
0.952 |
0.551 |
0.454 |
0.498 |
0.476 |
284 |
0.5 |
欲求 |
0.988 |
0.702 |
0.398 |
0.508 |
0.523 |
83 |
0.5 |
失望 |
0.972 |
0.500 |
0.152 |
0.234 |
0.265 |
151 |
0.5 |
非難 |
0.951 |
0.503 |
0.315 |
0.387 |
0.374 |
267 |
0.5 |
嫌悪 |
0.981 |
0.685 |
0.301 |
0.418 |
0.446 |
123 |
0.5 |
恥ずかしさ |
0.995 |
0.800 |
0.324 |
0.462 |
0.507 |
37 |
0.5 |
興奮 |
0.983 |
0.649 |
0.233 |
0.343 |
0.382 |
103 |
0.5 |
恐怖 |
0.991 |
0.738 |
0.577 |
0.647 |
0.648 |
78 |
0.5 |
感謝 |
0.990 |
0.955 |
0.895 |
0.924 |
0.919 |
352 |
0.5 |
悲しみ |
0.999 |
0.000 |
0.000 |
0.000 |
0.000 |
6 |
0.5 |
喜び |
0.980 |
0.658 |
0.646 |
0.652 |
0.642 |
161 |
0.5 |
愛情 |
0.983 |
0.795 |
0.815 |
0.805 |
0.796 |
238 |
0.5 |
不安 |
0.996 |
0.556 |
0.435 |
0.488 |
0.490 |
23 |
0.5 |
楽観主義 |
0.973 |
0.702 |
0.392 |
0.503 |
0.513 |
186 |
0.5 |
誇り |
0.998 |
0.800 |
0.250 |
0.381 |
0.446 |
16 |
0.5 |
気づき |
0.972 |
0.405 |
0.117 |
0.182 |
0.207 |
145 |
0.5 |
安心 |
0.998 |
0.000 |
0.000 |
0.000 |
0.000 |
11 |
0.5 |
後悔 |
0.992 |
0.566 |
0.839 |
0.676 |
0.686 |
56 |
0.5 |
悲しみ |
0.980 |
0.764 |
0.436 |
0.555 |
0.568 |
156 |
0.5 |
驚き |
0.980 |
0.692 |
0.447 |
0.543 |
0.547 |
141 |
0.5 |
中立 |
0.796 |
0.716 |
0.628 |
0.669 |
0.525 |
1787 |
0.5 |
最適な結果:
各ラベルに対してトレーニングデータセットを基に最適な閾値(F1スコアで調整)を使用し、テストデータセットでテストした結果です。
ラベル |
正解率 |
精度 |
再現率 |
F1スコア |
マシューズ相関係数 |
サポート数 |
閾値 |
マクロ平均 |
0.968 |
0.591 |
0.528 |
0.550 |
0.536 |
5427 |
様々 |
賞賛 |
0.947 |
0.722 |
0.702 |
0.712 |
0.683 |
504 |
0.40 |
喜び |
0.983 |
0.812 |
0.848 |
0.830 |
0.821 |
264 |
0.45 |
怒り |
0.966 |
0.548 |
0.460 |
0.500 |
0.485 |
198 |
0.25 |
苛立ち |
0.926 |
0.378 |
0.403 |
0.390 |
0.351 |
320 |
0.30 |
承認 |
0.928 |
0.445 |
0.470 |
0.457 |
0.419 |
351 |
0.30 |
思いやり |
0.975 |
0.496 |
0.430 |
0.460 |
0.449 |
135 |
0.35 |
混乱 |
0.966 |
0.417 |
0.510 |
0.459 |
0.444 |
153 |
0.30 |
好奇心 |
0.950 |
0.522 |
0.588 |
0.553 |
0.528 |
284 |
0.40 |
欲求 |
0.988 |
0.673 |
0.422 |
0.519 |
0.527 |
83 |
0.40 |
失望 |
0.964 |
0.338 |
0.305 |
0.321 |
0.303 |
151 |
0.30 |
非難 |
0.948 |
0.468 |
0.416 |
0.440 |
0.414 |
267 |
0.35 |
嫌悪 |
0.978 |
0.529 |
0.447 |
0.485 |
0.475 |
123 |
0.25 |
恥ずかしさ |
0.994 |
0.650 |
0.351 |
0.456 |
0.475 |
37 |
0.35 |
興奮 |
0.978 |
0.419 |
0.427 |
0.423 |
0.412 |
103 |
0.25 |
恐怖 |
0.990 |
0.662 |
0.628 |
0.645 |
0.640 |
78 |
0.40 |
感謝 |
0.990 |
0.955 |
0.895 |
0.924 |
0.919 |
352 |
0.50 |
悲しみ |
0.999 |
0.750 |
0.500 |
0.600 |
0.612 |
6 |
0.35 |
喜び |
0.980 |
0.660 |
0.640 |
0.650 |
0.639 |
161 |
0.50 |
愛情 |
0.982 |
0.774 |
0.836 |
0.804 |
0.795 |
238 |
0.45 |
不安 |
0.995 |
0.435 |
0.435 |
0.435 |
0.432 |
23 |
0.45 |
楽観主義 |
0.972 |
0.597 |
0.565 |
0.580 |
0.566 |
186 |
0.25 |
誇り |
0.998 |
0.667 |
0.375 |
0.480 |
0.499 |
16 |
0.15 |
気づき |
0.962 |
0.273 |
0.248 |
0.260 |
0.241 |
145 |
0.25 |
安心 |
0.999 |
0.800 |
0.364 |
0.500 |
0.539 |
11 |
0.25 |
後悔 |
0.993 |
0.641 |
0.732 |
0.683 |
0.681 |
56 |
0.65 |
悲しみ |
0.978 |
0.646 |
0.538 |
0.587 |
0.579 |
156 |
0.30 |
驚き |
0.979 |
0.603 |
0.518 |
0.557 |
0.548 |
141 |
0.40 |
中立 |
0.791 |
0.669 |
0.722 |
0.695 |
0.537 |
1787 |
0.40 |
想定される使用方法
このモデルは、英語のテキストの感情分類を目的として設計されています。特に以下の分野での使用が想定されています。
- ソーシャルメディアのセンチメント分析
- 顧客フィードバックの評価
- 行動または心理学的な研究
制限とバイアス
- データバイアス: このデータセットはRedditのコメントに基づいているため、他のドメインや文化的な文脈には汎化しにくい可能性があります。
- 少数クラス: "悲しみ" や "安心" などの特定のラベルは例が非常に少ないため、これらのクラスに対する性能が低くなる可能性があります。
- 曖昧性: 一部のトレーニングデータにはアノテーションの不一致や曖昧さが含まれており、予測に影響を与える可能性があります。
環境への影響
引用
このモデルを使用する場合は、以下のように引用してください。
@inproceedings{JdFE2025c,
title = {Emotion Classification with ModernBERT},
author = {Enric Junqu\'e de Fortuny},
year = {2025},
howpublished = {\url{https://huggingface.co/cirimus/modernbert-large-go-emotions}},
}
📄 ライセンス
このモデルは MIT ライセンスの下で公開されています。