🚀 DeBERTa 情感預測器
本項目提供了一個基於 DeBERTa 的模型,用於預測日語文本中的情感。藉助預訓練的 DeBERTa 模型,該 Python 包能夠對日語文本進行情感推斷。它提供了針對 8 種情感(喜悅、悲傷、期待、驚訝、憤怒、恐懼、厭惡、信任)的模型,可輕鬆獲取每個文本的情感預測標籤和肯定類別的置信度。
🚀 快速開始
安裝
使用 pip 進行安裝:
pip install deberta-emotion-predictor
使用示例
基礎用法
from deberta_emotion_predictor import DeBERTaEmotionPredictor
predictor = DeBERTaEmotionPredictor()
result = predictor.predict_emotions("今日はとても嬉しい!")
predictor.show_emotions(result)
注:由於需要從 Hugging-face 下載 8 種 DeBERTa 模型,首次啟動會比較耗時,後續運行速度會加快。
高級用法
還可以輸入數據框進行預測:
import pandas as pd
from deberta_emotion_predictor import DeBERTaEmotionPredictor
predictor = DeBERTaEmotionPredictor()
sample_texts = [
"そうだ 京都、行こう。",
"がんばるひとの、がんばらない時間。",
"わたしらしくをあたらしく",
"ピースはここにある。",
"結婚しなくても幸せになれるこの時代に、私は、あなたと結婚したいのです。",
"これからの地球のために一肌、脫ぎました。",
"自分は、きっと想像以上だ。",
"ハローしあわせ。",
"日本を、1枚で。"
]
res_df = predictor.predict_emotions(sample_texts)
predictor.show_emotions(res_df)
運行該包需要安裝 torch
、transformers
和 pandas
:
pip install torch
pip install transformers
pip install pandas
另外,如果要使用 GPU,需要安裝 NVIDIA GPU 驅動等,具體請參考其他資料。
✨ 主要特性
- 8 種情感推斷:使用針對每種情感微調的模型,對文本進行情感推斷。
- 靈活的輸入形式:支持單一文本、文本列表或 pandas Series 作為輸入,並以 DataFrame 形式返回結果。
- 高效的推理:為了減少 GPU 內存使用,設計為僅在需要時將模型加載到 GPU 上。
📚 詳細文檔
文本傳遞方式(列表)
sample_texts = [
"そうだ 京都、行こう。",
"がんばるひとの、がんばらない時間。"
]
result_df = predictor.predict_emotions(sample_texts)
predictor.show_emotions(result_df)
單一文本情況
result_single = predictor.predict_emotions("新しい朝が來た。")
print(result_single)
輸出的數據框
輸出的數據框包含表示每種情感是否存在的 8 列,以及每種情感的概率值。
print(result_df)
🔧 技術細節
目錄結構
deberta_emotion_predictor/
├── README.md # 本說明文件
├── deberta_emotion_predictor.py # DeBERTaEmotionPredictor 類的實現
│ └── tokenizer_DeBERTa_v3_large/ # 分詞器
├── setup.py
├── pyproject.toml
├── README.md
├── LICENSE
└── usage.py
必要環境
- Python 3.6 及以上
- PyTorch
- transformers
- pandas
📄 許可證
本項目採用知識共享署名 - 相同方式共享 4.0 國際許可協議(CC BY - SA 4.0)。
版權所有 (c) 2025 Yoichi Takenaka
本作品根據知識共享署名 - 相同方式共享 4.0 國際許可協議進行許可。要查看此許可協議的副本,請訪問 https://creativecommons.org/licenses/by-sa/4.0/
本項目基於以下內容:
- DeBERTa (https://huggingface.co/microsoft/deberta-v3-large),採用 MIT 許可協議。
- DeBERTa 日語模型 (https://huggingface.co/globis-university/deberta-v3-japanese-large),採用 CC BY - SA 4.0 許可協議。
任何修改或派生作品也必須根據相同的 CC BY - SA 4.0 許可協議進行分發。