rubert_tiny2_russian_emotion_sentimentオープンソースモデル - ロシア語の5つの感情を識別し、感情を簡単に把握

ホーム

Rubert Tiny2 Russian Emotion Sentiment

Kostya165によって開発

軽量RuBERT-tiny2をファインチューニングしたロシア語感情分類モデルで、5つの感情を識別可能

テキスト分類

Safetensors

その他#ロシア語感情分析 #軽量BERT #多感情分類

ダウンロード数 51

リリース時間 : 4/21/2025

モデル概要

このモデルはロシア語テキスト中の5つの感情（攻撃性、不安、中立、積極的、皮肉）を識別します。

モデル特徴

軽量モデル

rubert-tiny2アーキテクチャ採用でモデルサイズが小さく推論速度が速い

多感情分類

攻撃性、不安など5つの異なる感情状態を識別可能

高精度

検証データセットで89.11%の精度を達成

モデル能力

ロシア語テキスト感情分析

感情状態分類

短文感情認識

使用事例

ソーシャルメディア分析

フォーラム感情モニタリング

ロシア語フォーラム投稿の感情傾向を分析

攻撃性や皮肉などの否定的感情を識別可能

カスタマーサービス

顧客フィードバック分析

ロシア語顧客フィードバックの感情状態を自動分類

不安や怒りのある顧客を特定するのに役立つ

🚀 rubert_tiny2_russian_emotion_sentiment

このモデルは、軽量なモデルcointegrated/rubert-tiny2をファインチューニングしたもので、ロシア語のメッセージ内の5つの感情を分類することができます。

🚀 クイックスタート

このモデルを使用するには、まず必要なライブラリをインストールする必要があります。以下のコマンドを実行してください。

pip install transformers torch

次に、以下のPythonコードを使用してモデルをロードし、テキスト分類を行うことができます。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# モデルとトークナイザーをロード
MODEL_ID = "Kostya165/rubert_tiny2_russian_emotion_sentiment"
tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
model     = AutoModelForSequenceClassification.from_pretrained(MODEL_ID)
model.eval()

texts = [
    "Сегодня отличный день!",
    "Меня это всё бесит и раздражает."
]

# トークナイズ
enc = tokenizer(texts, padding=True, truncation=True, max_length=128, return_tensors="pt")
with torch.no_grad():
    logits = model(**enc).logits
    preds = logits.argmax(dim=-1).tolist()

# IDをラベルに変換
id2label = model.config.id2label
labels = [id2label[p] for p in preds]
print(labels)  # 例: ['positive', 'aggression']

✨ 主な機能

ロシア語のメッセージ内の5つの感情を分類することができます。
- 0: aggression (攻撃性)
- 1: anxiety (不安)
- 2: neutral (中立)
- 3: positive (ポジティブ)
- 4: sarcasm (皮肉)

📦 インストール

このモデルを使用するには、以下のライブラリが必要です。

transformers>=4.30.0
torch>=1.10.0
datasets
evaluate

以下のコマンドを実行して、必要なライブラリをインストールしてください。

pip install transformers torch datasets evaluate

📚 ドキュメント

検証結果

指標	値
Accuracy	0.8911
F1 macro	0.8910
F1 micro	0.8911

クラスごとの精度:

攻撃性 (0): 0.9120
不安 (1): 0.9462
中立 (2): 0.8663
ポジティブ (3): 0.8884
皮肉 (4): 0.8426

学習の詳細

ベースモデル: cointegrated/rubert-tiny2
データセット: Kostya165/ru_emotion_dvach
エポック数: 2
バッチサイズ: 32
学習率: 1e-5
混合精度: FP16
正則化: Dropout 0.1, weight_decay 0.01, warmup_ratio 0.1

🔧 技術詳細

このモデルは、軽量なモデルcointegrated/rubert-tiny2をファインチューニングして作成されています。ロシア語のメッセージ内の5つの感情を分類するために、特定のデータセットで学習されています。

📄 ライセンス

このモデルはCC-BY-SA 4.0ライセンスの下で提供されています。

📖 引用

@article{rubert_tiny2_russian_emotion_sentiment,
  title   = {Russian Emotion Sentiment Classification with RuBERT-tiny2},
  author  = {Kostya165},
  year    = {2024},
  howpublished = {\url{https://huggingface.co/Kostya165/rubert_tiny2_russian_emotion_sentiment}}
}