🚀 金融情感微调版FinBERT(金融短语库 + GitHub数据集)
本模型是基于金融情感分类任务对FinBERT进行微调的版本,能够有效处理金融文本情感分析问题,为金融领域的决策和研究提供有力支持。
🚀 快速开始
你可以通过Hugging Face Transformers库使用该模型:
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model_name = "Driisa/finbert-finetuned-github"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
text = "The company's stock has seen significant growth this quarter."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)
outputs = model(**inputs)
predicted_class = outputs.logits.argmax().item()
print(f"Predicted Sentiment: {['Negative', 'Neutral', 'Positive'][predicted_class]}")
✨ 主要特性
- 该模型是FinBERT (
ProsusAI/finbert
) 的微调版本,专门用于金融情感分类。
- 能够将金融文本分为三类:
📦 安装指南
文档未提及安装步骤,故跳过该章节。
💻 使用示例
基础用法
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model_name = "Driisa/finbert-finetuned-github"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
text = "The company's stock has seen significant growth this quarter."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)
outputs = model(**inputs)
predicted_class = outputs.logits.argmax().item()
print(f"Predicted Sentiment: {['Negative', 'Neutral', 'Positive'][predicted_class]}")
📚 详细文档
📂 使用的数据集
该模型在以下数据集上进行训练:
✅ 金融短语库 - 一个广泛使用的金融情感数据集。
✅ GitHub生成的情感数据集 - 用于测试模型的额外数据集。
⚙️ 训练参数
参数 |
值 |
模型架构 |
FinBERT(基于BERT) |
批量大小 |
8 |
学习率 |
2e - 5 |
训练轮数 |
3 |
优化器 |
AdamW |
评估指标 |
F1分数、准确率 |
📊 模型性能
数据集 |
准确率 |
F1(加权) |
精确率 |
召回率 |
金融短语库(训练集) |
95.21% |
95.23% |
95.32% |
95.21% |
GitHub测试集 |
64.42% |
64.34% |
70.52% |
64.42% |
🚀 预期用途
该模型适用于:
✅ 金融分析师和投资者,用于评估报告、新闻和股票讨论等金融语句的情感。
✅ 金融机构,用于自动化交易中基于自然语言处理的情感分析。
✅ 人工智能研究人员,探索金融自然语言处理模型。
⚠️ 局限性
⚠️ 重要提示
该模型可能无法很好地泛化到金融语言差异较大的数据集。
可能需要针对特定金融领域(加密货币、银行业、初创企业)进行微调。
🔧 技术细节
文档未提供具体技术实现细节,故跳过该章节。
📄 许可证
本模型使用的许可证为MIT许可证。