🚀 DeBERTa 情感预测器
DeBERTa 情感预测器是一个基于微调后的 DeBERTa 模型,用于进行日语文本情感预测的 Python 包。它提供了 8 种情感(喜悦、悲伤、期待、惊讶、愤怒、恐惧、厌恶、信任)的预测模型,能够轻松获取每个文本的情感预测标签和肯定类别的置信度。
🚀 快速开始
DeBERTa 情感预测器可以帮助你快速对日语文本进行情感分析,下面将为你介绍如何安装和使用它。
📦 安装指南
你可以使用 pip 来安装本包:
pip install deberta-emotion-predictor
此外,运行该包还需要安装 torch
、transformers
和 pandas
:
pip install torch
pip install transformers
pip install pandas
⚠️ 重要提示
若要使用 GPU,需要安装 NVIDIA GPU 驱动程序等,请参考其他资料进行安装。
💻 使用示例
基础用法
from deberta_emotion_predictor import DeBERTaEmotionPredictor
predictor = DeBERTaEmotionPredictor()
result = predictor.predict_emotions("今日はとても嬉しい!")
predictor.show_emotions(result)
高级用法
你也可以输入一个数据框进行批量预测:
import pandas as pd
from deberta_emotion_predictor import DeBERTaEmotionPredictor
predictor = DeBERTaEmotionPredictor()
sample_texts = [
"そうだ 京都、行こう。",
"がんばるひとの、がんばらない時間。",
"わたしらしくをあたらしく",
"ピースはここにある。",
"結婚しなくても幸せになれるこの時代に、私は、あなたと結婚したいのです。",
"これからの地球のために一肌、脱ぎました。",
"自分は、きっと想像以上だ。",
"ハローしあわせ。",
"日本を、1枚で。"
]
res_df = predictor.predict_emotions(sample_texts)
predictor.show_emotions(res_df)
⚠️ 重要提示
由于需要从 Hugging-face 下载 8 种 DeBERTa 模型,首次启动会非常耗时,后续运行会加快。
文本传递方式(列表)
sample_texts = [
"そうだ 京都、行こう。",
"がんばるひとの、がんばらない時間。"
]
result_df = predictor.predict_emotions(sample_texts)
predictor.show_emotions(result_df)
单一文本的情况
result_single = predictor.predict_emotions("新しい朝が来た。")
print(result_single)
输出的数据框
输出的数据框包含表示每种情感是否存在的 8 列,以及每种情感的概率值:
print(result_df)
✨ 主要特性
- 8 种情感预测:使用针对每种情感微调的模型进行文本情感预测。
- 灵活的输入形式:接受单一文本、文本列表或 pandas Series 作为输入,并以 DataFrame 形式返回结果。
- 高效推理:为了减少 GPU 内存使用,仅在需要时将模型加载到 GPU。
📚 详细文档
目录结构
deberta_emotion_predictor/
├── README.md # 此说明文件
├── deberta_emotion_predictor.py # DeBERTaEmotionPredictor 类的实现
│ └── tokenizer_DeBERTa_v3_large/ # 分词器
├── setup.py
├── pyproject.toml
├── README.md
├── LICENSE
└── usage.py
必要环境
- Python 3.6 及以上
- PyTorch
- transformers
- pandas
📄 许可证
本项目采用知识共享署名 - 相同方式共享 4.0 国际许可协议(CC BY - SA 4.0)。
版权所有 (c) 2025 Yoichi Takenaka
本作品采用知识共享署名 - 相同方式共享 4.0 国际许可协议进行许可。要查看此许可协议的副本,请访问 https://creativecommons.org/licenses/by - sa/4.0/。
本项目基于以下内容:
- DeBERTa (https://huggingface.co/microsoft/deberta - v3 - large),采用 MIT 许可协议。
- DeBERTa 日语模型 (https://huggingface.co/globis - university/deberta - v3 - japanese - large),采用 CC BY - SA 4.0 许可协议。
任何修改或派生作品也必须根据相同的 CC BY - SA 4.0 许可协议进行分发。