🚀 模型卡片:SSAF - FinBert
SSAF - FinBert 模型是 FinBert 模型的微调版本,专为股票市场新闻文章的情感分析而设计。它能够将金融文本数据中表达的情感分为积极、消极和中性三类。
🚀 快速开始
本模型是在从 Kaggle 收集的数据集上进行训练的。经过预处理后,使用 FinBert 架构在 GPU 集群上进行了大约 5 小时的微调。根据训练所用的平台,最终模型的准确率在 81% 至 82% 之间。
✨ 主要特性
- 情感分类:可将金融文本情感精准分为积极、消极和中性三类。
- 高准确率:在金融文本情感分析任务中,准确率可达 81% - 82%。
📦 安装指南
无具体安装命令,跳过此章节。
💻 使用示例
基础用法
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch
tokenizer = AutoTokenizer.from_pretrained('yiyanghkust/finbert-pretrain')
model_path = "likith123/SSAF-FinBert"
model = AutoModelForSequenceClassification.from_pretrained(model_path)
def predict_sentiment(input_text):
inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
predicted_probs = torch.softmax(outputs.logits, dim=1).squeeze().tolist()
return predicted_probs
此代码加载了预训练的分词器和微调后的 SSAF - FinBert 模型。你可以使用 predict_sentiment
函数来分析金融文本数据的情感。
高级用法
text_data = "This is a positive news article about the stock market."
predicted_sentiment = predict_sentiment(text_data)
print(predicted_sentiment)
调用 predict_sentiment
函数,将金融文本数据作为输入,该函数将返回每个情感类别(积极、消极和中性)的预测概率。predicted_sentiment
变量将包含一个对应于每个情感类别的概率列表,让你能够分析输入文本中表达的情感。
📚 详细文档
标签映射
- Label_0 = 消极
- Label_1 = 中性
- Label_2 = 积极
实际微调过程
🔧 技术细节
SSAF - FinBert 模型在与金融文本数据相关的情感分析任务中表现出色。不过,模型的准确率可能会因输入文本的性质和复杂性而有所不同。虽然该模型在对金融新闻文章的情感分类方面表现优异,但在其他领域或处理高度专业化的金融术语时,可能无法达到最佳性能。
📄 许可证
本模型采用 MIT 许可证。
致谢
SSAF - FinBert 模型的开发得益于开源社区的贡献以及 Hugging Face 提供的资源。我们感谢为基于 Transformer 的自然语言处理任务模型的开发和改进做出贡献的开发者和研究人员。
如需获取 SSAF - FinBert 模型的更多信息和更新,请参考 模型卡片。