Bert Emotion

boltuixによって開発

BERT-Emotionは、bert-liteとNeuroBERT-Miniをベースにした軽量自然言語処理モデルで、エッジおよびIoTデバイス上の短いテキストの感情検出に最適化されています。

テキスト分類

Transformers

オープンソースライセンス:Apache-2.0 #軽量感情検出 #エッジデバイス最適化 #短いテキスト分析

ダウンロード数 369

リリース時間 : 3/27/2025

モデル概要

リアルタイム感情検出のための軽量BERTモデルで、テキストを13種類の豊富な感情カテゴリに分類し、高い精度を発揮します。

モデル特徴

コンパクト設計

約20MBのストレージ占有で、ストレージが限られたデバイスに適しています。

豊富な感情検出

13種類の感情を分類し、生き生きとした絵文字にマッピングします。

オフライン機能

インターネット接続なしで動作可能。

リアルタイム推論

CPU、モバイルNPU、マイクロコントローラー向けに最適化されています。

多様なアプリケーション

短いテキストの感情検出、感情分析、トーン分析をサポートします。

モデル能力

感情検出

感情分析

テキスト分類

絵文字マッピング

リアルタイム推論

エッジコンピューティング

使用事例

チャットボット

感情理解

ユーザーの感情を検出し、返答をパーソナライズします。

例：「愛してる」は「愛 ❤️」と予測されます。

ソーシャルメディア

感情タグ付け

コンテンツモデレーションのために投稿の感情を分析します。

例：「これはひどい！」は「嫌悪 🤢」と予測されます。

メンタルヘルス

感情モニタリング

健康アプリのためにユーザーの感情をモニタリングします。

例：「孤独を感じる」は「悲しみ 😢」と予測されます。

license: apache-2.0 language:

en metrics:
precision
recall
f1
accuracy new_version: v1.1 datasets:
custom
chatgpt pipeline_tag: text-classification library_name: transformers tags:
emotion
classification
text-classification
bert
emojis
emotions
v1.0
sentiment-analysis
nlp
lightweight
chatbot
social-media
mental-health
short-text
emotion-detection
transformers
real-time
expressive
ai
machine-learning
english
inference
edge-ai
smart-replies
tone-analysis base_model:
boltuix/bert-lite
boltuix/bitBERT

バナー

😊 BERT-Emotion — 軽量BERTによるリアルタイム感情検出 🌟

📖 概要
✨ 主な特徴
💫 対応感情
⚙️ インストール
📥 ダウンロード方法
🚀 クイックスタート: 感情検出
📊 評価
💡 使用例
🖥️ ハードウェア要件
📚 学習データ
🔧 ファインチューニングガイド
⚖️ 他のモデルとの比較
🏷️ タグ
📄 ライセンス
🙏 クレジット
💬 サポート＆コミュニティ
✍️ 連絡先

バナー

概要

BERT-Emotionは、bert-liteとNeuroBERT-Miniをベースにした軽量NLPモデルで、エッジデバイスやIoTデバイス向けに短いテキストの感情検出用にファインチューニングされています。量子化後のサイズは約20MB、パラメータ数は約600万で、テキストを13種類の感情カテゴリ（例: 幸福、悲しみ、怒り、愛）に高精度で分類します。低遅延とオフライン動作に最適化されており、モバイルアプリ、ウェアラブルデバイス、スマートホームデバイスなどのリソースが限られた環境でのチャットボット、SNS感情分析、メンタルヘルスモニタリングなど、プライバシーを重視するアプリケーションに最適です。

モデル名: BERT-Emotion
サイズ: 約20MB（量子化後）
パラメータ数: 約600万
アーキテクチャ: 軽量BERT（4層、隠れ層サイズ128、アテンションヘッド4）
説明: 感情検出用の軽量4層128隠れ層モデル
ライセンス: Apache-2.0 — 商用・個人利用無料

主な特徴

⚡ コンパクト設計: 約20MBの小さなフットプリントでストレージが限られたデバイスにも対応
🧠 豊富な感情検出: 13種類の感情を絵文字マッピング付きで分類
📶 オフライン機能: インターネット接続不要で完全動作
⚙️ リアルタイム推論: CPU、モバイルNPU、マイクロコントローラ向けに最適化
🌍 多様な用途: 短いテキスト向けの感情検出、感情分析、トーン分析をサポート

対応感情

BERT-Emotionはテキストを13種類の感情カテゴリに分類し、各感情には解釈を容易にするための絵文字がマッピングされています:

感情	絵文字
悲しみ	😢
怒り	😠
愛	❤️
驚き	😲
恐怖	😱
幸福	😄
中立	😐
嫌悪	🤢
恥	🙈
罪悪感	😔
混乱	😕
欲望	🔥
皮肉	😏

インストール

必要な依存関係をインストール:

pip install transformers torch

Python 3.6以上が動作し、モデル重み用に約20MBのストレージがある環境を確保してください。

ダウンロード方法

Hugging Face経由:
- boltuix/bert-emotionでモデルにアクセス
- モデルファイル（約20MB）をダウンロードまたはリポジトリをクローン:
```
git clone https://huggingface.co/boltuix/bert-emotion
```

Transformersライブラリ経由:

Pythonで直接モデルをロード:

from transformers import AutoModelForSequenceClassification, AutoTokenizer
model = AutoModelForSequenceClassification.from_pretrained("boltuix/bert-emotion")
tokenizer = AutoTokenizer.from_pretrained("boltuix/bert-emotion")

手動ダウンロード:
- Hugging Faceモデルハブから量子化済みモデル重み（Safetensors形式）をダウンロード
- 解凍してエッジ/IoTアプリケーションに統合

クイックスタート: 感情検出

基本的な推論例

Hugging Faceパイプラインを使用して短いテキスト入力の感情を分類:

from transformers import pipeline

# ファインチューニング済みBERT-Emotionモデルをロード
sentiment_analysis = pipeline("text-classification", model="boltuix/bert-emotion")

# 感情を分析
result = sentiment_analysis("i love you")
print(result)

出力:

[{'label': 'Love', 'score': 0.8442274928092957}]

これは感情が愛 ❤️で、信頼度**84.42%**であることを示します。

絵文字マッピング付き拡張例

人間が読みやすい感情と絵文字で出力を強化:

from transformers import pipeline

# ファインチューニング済みBERT-Emotionモデルをロード
sentiment_analysis = pipeline("text-classification", model="boltuix/bert-emotion")

# ラベルから絵文字へのマッピングを定義
label_to_emoji = {
    "Sadness": "😢",
    "Anger": "😠",
    "Love": "❤️",
    "Surprise": "😲",
    "Fear": "😱",
    "Happiness": "😄",
    "Neutral": "😐",
    "Disgust": "🤢",
    "Shame": "🙈",
    "Guilt": "😔",
    "Confusion": "😕",
    "Desire": "🔥",
    "Sarcasm": "😏"
}

# 入力テキスト
text = "i love you"

# 感情を分析
result = sentiment_analysis(text)[0]
label = result["label"].capitalize()
emoji = label_to_emoji.get(label, "❓")

# 出力
print(f"テキスト: {text}")
print(f"予測感情: {label} {emoji}")
print(f"信頼度: {result['score']:.2%}")

出力:

テキスト: i love you
予測感情: Love ❤️
信頼度: 84.42%

注: 特定のドメインや追加の感情カテゴリに対してモデルをファインチューニングすると精度が向上します。

評価

BERT-Emotionは、IoTやSNSの文脈に関連する13の短いテキストサンプルを用いた感情分類タスクで評価されました。モデルは13の感情ラベルのうち1つを予測し、正しいラベルが予測された場合に成功とみなされます。

テスト文

文	期待される感情
I love you so much!	愛
This is absolutely disgusting!	嫌悪
I'm so happy with my new phone!	幸福
Why does this always break?	怒り
I feel so alone right now.	悲しみ
What just happened?!	驚き
I'm terrified of this update failing.	恐怖
Meh, it's just okay.	中立
I shouldn't have said that.	恥
I feel bad for forgetting.	罪悪感
Wait, what does this mean?	混乱
I really want that new gadget!	欲望
Oh sure, like that's gonna work.	皮肉

評価コード

from transformers import pipeline

# ファインチューニング済みBERT-Emotionモデルをロード
sentiment_analysis = pipeline("text-classification", model="boltuix/bert-emotion")

# ラベルから絵文字へのマッピングを定義
label_to_emoji = {
    "Sadness": "😢",
    "Anger": "😠",
    "Love": "❤️",
    "Surprise": "😲",
    "Fear": "😱",
    "Happiness": "😄",
    "Neutral": "😐",
    "Disgust": "🤢",
    "Shame": "🙈",
    "Guilt": "😔",
    "Confusion": "😕",
    "Desire": "🔥",
    "Sarcasm": "😏"
}

# テストデータ
tests = [
    ("I love you so much!", "Love"),
    ("This is absolutely disgusting!", "Disgust"),
    ("I'm so happy with my new phone!", "Happiness"),
    ("Why does this always break?", "Anger"),
    ("I feel so alone right now.", "Sadness"),
    ("What just happened?!", "Surprise"),
    ("I'm terrified of this update failing.", "Fear"),
    ("Meh, it's just okay.", "Neutral"),
    ("I shouldn't have said that.", "Shame"),
    ("I feel bad for forgetting.", "Guilt"),
    ("Wait, what does this mean?", "Confusion"),
    ("I really want that new gadget!", "Desire"),
    ("Oh sure, like that's gonna work.", "Sarcasm")
]

results = []

# テストを実行
for text, expected in tests:
    result = sentiment_analysis(text)[0]
    predicted = result["label"].capitalize()
    confidence = result["score"]
    emoji = label_to_emoji.get(predicted, "❓")
    results.append({
        "sentence": text,
        "expected": expected,
        "predicted": predicted,
        "confidence": confidence,
        "emoji": emoji,
        "pass": predicted == expected
    })

# 結果を表示
for r in results:
    status = "✅ 合格" if r["pass"] else "❌ 不合格"
    print(f"\n🔍 {r['sentence']}")
    print(f"🎯 期待: {r['expected']}")
    print(f"🔝 予測: {r['predicted']} {r['emoji']} (信頼度: {r['confidence']:.4f})")
    print(status)

# サマリー
pass_count = sum(r["pass"] for r in results)
print(f"\n🎯 総合格数: {pass_count}/{len(tests)}")

サンプル結果（仮想的なもの）

文: I love you so much!
期待: 愛
予測: 愛 ❤️ (信頼度: 0.8442)
結果: ✅ 合格
文: I feel so alone right now.
期待: 悲しみ
予測: 悲しみ 😢 (信頼度: 0.7913)
結果: ✅ 合格
総合格数: ~11/13（ファインチューニングに依存）

BERT-Emotionは、特にIoTやSNSの文脈における短いテキストの幅広い感情分類に優れており、恥や皮肉などの微妙な感情に対してはファインチューニングでさらに性能を向上させることができます。

評価指標

指標	値（概算）
✅ 精度	13クラス感情タスクで約90–95%
🎯 F1スコア	マルチクラス分類でバランス良好
⚡ 遅延	Raspberry Piで45ms未満
📏 再現率	軽量モデルとして競争力あり

注: 指標はハードウェア（例: Raspberry Pi 4、Androidデバイス）やファインチューニングによって異なります。正確な結果を得るには対象デバイスでテストしてください。

使用例

BERT-Emotionは、短いテキストのリアルタイム感情検出を必要とするエッジおよびIoTシナリオ向けに設計されています。主なアプリケーションは以下の通りです:

チャットボット感情理解: 「I love you」（「愛 ❤️」と予測）などのユーザー感情を検出し、応答をパーソナライズ
SNS感情タグ付け: 「This is disgusting!」（「嫌悪 🤢」と予測）などの投稿を分析し、コンテンツモデレーションに活用
メンタルヘルス状況検出: 「I feel so alone」（「悲しみ 😢」と予測）などのユーザー気分をモニタリングし、ウェルネスアプリに活用
スマート返信とリアクション: 「I’m so happy!」（「幸福 😄」と予測）などの感情に基づいて返信を提案
感情トーン分析: 「I’m terrified!」（「恐怖 😱」と予測）などの感情に応じてIoTデバイスの設定を調整（例: 快適さのために照明を暗くする）
音声アシスタント: 「Why does it break?」（「怒り 😠」と予測）などの感情をローカルで解析し、修正を優先
玩具ロボティクス: 「I really want that!」（「欲望 🔥」と予測）などの感情に基づいてインタラクションを駆動
フィットネストラッカー: 「Wait, what?」（「混乱 😕」と予測）などのフィードバックを分析し、説明を明確化

ハードウェア要件

プロセッサ: CPU、モバイルNPU、またはマイクロコントローラ（例: ESP32-S3、Raspberry Pi 4）
ストレージ: モデル重み用に約20MB（量子化済み、Safetensors形式）
メモリ: 推論用に約60MB RAM
環境: オフラインまたは低接続環境

量子化によりメモリ使用効率が向上し、リソースが限られたデバイスに適しています。

学習データ

カスタム感情データセット: 13のラベル付き感情（例: 幸福、悲しみ、愛）を含むキュレーションされた短いテキストデータで、カスタムデータセットとchatgpt-datasetsから収集。チャットボット、SNS、スマートデバイスの文脈での性能向上のために、SNSやIoTユーザーフィードバックで拡張。

最適な結果を得るには、ドメイン固有のデータでファインチューニングすることを推奨します。

ファインチューニングガイド

BERT-Emotionをカスタム感情検出タスク（例: 特定のチャットボットやIoTインタラクション）に適応させるには:

データセットの準備: 13の感情カテゴリを含むラベル付きデータを収集

Hugging Faceでファインチューニング:

 # !pip install transformers datasets torch --upgrade

 import torch
 from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments
 from datasets import Dataset
 import pandas as pd

 # 1. サンプル感情データセットを準備
 data = {
     "text": [
         "I love you so much!",
         "This is absolutely disgusting!",
         "I'm so happy with my new phone!",
         "Why does this always break?",
         "I feel so alone right now."
     ],
     "label": [2, 7, 5, 1, 0]  # 感情: 0から12
 }
 df = pd.DataFrame(data)
 dataset = Dataset.from_pandas(df)

 # 2. トークナイザーとモデルをロード
 model_name = "boltuix/bert-emotion"
 tokenizer = BertTokenizer.from_pretrained(model_name)
 model = BertForSequenceClassification.from_pretrained(model_name, num_labels=13)

 # 3. データセットをトークン化
 def tokenize_function(examples):
     return tokenizer(examples["text"], padding="max_length", truncation=True, max_length=64)

 tokenized_dataset = dataset.map(tokenize_function, batched=True)

 # 4. すべてのフィールドをPyTorchテンソルに手動変換（NumPy 2.0対応）
 def to_torch_format(example):
     return {
         "input_ids": torch.tensor(example["input_ids"]),
         "attention_mask": torch.tensor(example["attention_mask"]),
         "label": torch.tensor(example["label"])
     }

 tokenized_dataset = tokenized_dataset.map(to_torch_format)

 # 5. トレーニング引数を定義
 training_args = TrainingArguments(
     output_dir="./bert_emotion_results",
     num_train_epochs=5,
     per_device_train_batch_size=2,
     logging_dir="./bert_emotion_logs",
     logging_steps=10,
     save_steps=100,
     eval_strategy="no",
     learning_rate=3e-5,
     report_to="none"  # 必要なければW&B自動ロギングを無効化
 )

 # 6. Trainerを初期化
 trainer = Trainer(
     model=model,
     args=training_args,
     train_dataset=tokenized_dataset,
 )

 # 7. モデルをファインチューニング
 trainer.train()

 # 8. ファインチューニング済みモデルを保存
 model.save_pretrained("./fine_tuned_bert_emotion")
 tokenizer.save_pretrained("./fine_tuned_bert_emotion")

 # 9. 推論例
 text = "I'm thrilled with the update!"
 inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=64)
 model.eval()
 with torch.no_grad():
     outputs = model(**inputs)
     logits = outputs.logits
     predicted_class = torch.argmax(logits, dim=1).item()

 labels = ["Sadness", "Anger", "Love", "Surprise", "Fear", "Happiness", "Neutral", "Disgust", "Shame", "Guilt", "Confusion", "Desire", "Sarcasm"]
 print(f"'{text}'の予測感情: {labels[predicted_class]}")

デプロイ: ファインチューニング済みモデルをONNXまたはTensorFlow Lite形式にエクスポートし、エッジデバイスに展開

他のモデルとの比較

モデル	パラメータ数	サイズ	エッジ/IoT焦点	対応タスク
BERT-Emotion	約600万	約20MB	高	感情検出、分類
BERT-Lite	約200万	約10MB	高	MLM、NER、分類
NeuroBERT-Mini	約700万	約35MB	高	MLM、NER、分類
DistilBERT	約6600万	約200MB	中	MLM、NER、分類、感情分析

BERT-Emotionは13クラス感情検出に特化しており、BERT-Liteなどの汎用モデルと比較してエッジデバイスでの短いテキストの感情分析において優れた性能を発揮し、DistilBERTよりも大幅に効率的です。

#BERT-Emotion #エッジNLP #感情検出 #オンデバイスAI #オフラインNLP
#モバイルAI #感情分析 #テキスト分類 #絵文字 #感情
#軽量トランスフォーマー #組み込みNLP #スマートデバイスAI #低遅延モデル
#IoT向けAI #効率的BERT #NLP2025 #コンテキスト認識 #エッジML
#スマートホームAI #感情認識 #音声AI #エコAI #チャットボット #SNS
#メンタルヘルス #短いテキスト #スマート返信 #トーン分析