SSAF-FinBert开源模型 - 精准分类金融文本情感，助力股票市场新闻分析

首页

SSAF FinBert

由 likith123 开发

SSAF-FinBert是基于FinBert微调的股票市场新闻情感分析模型，能分类金融文本为积极、消极和中性三类情感。

文本分类

Transformers

开源协议:MIT #金融情感分析 #股票新闻分类 #高准确率(82%)

下载量 69

发布时间 : 3/4/2024

模型简介

该模型专为金融文本情感分析设计，在Kaggle数据集上微调，准确率达81%-82%。

模型特点

金融领域优化

专门针对股票市场新闻文章进行微调，优化了金融术语的理解能力

三分类情感分析

能将文本情感准确分类为积极、消极和中性三类

高准确率

在不同训练平台上达到81%-82%的准确率

模型能力

金融文本情感分类

股票新闻情绪分析

三分类概率预测

使用案例

金融分析

股票新闻情绪监测

分析股票相关新闻的情绪倾向，辅助投资决策

准确率81%-82%

市场情绪分析

追踪市场整体情绪变化，预测市场趋势

🚀 模型卡片：SSAF - FinBert

SSAF - FinBert 模型是 FinBert 模型的微调版本，专为股票市场新闻文章的情感分析而设计。它能够将金融文本数据中表达的情感分为积极、消极和中性三类。

🚀 快速开始

本模型是在从 Kaggle 收集的数据集上进行训练的。经过预处理后，使用 FinBert 架构在 GPU 集群上进行了大约 5 小时的微调。根据训练所用的平台，最终模型的准确率在 81% 至 82% 之间。

✨ 主要特性

情感分类：可将金融文本情感精准分为积极、消极和中性三类。
高准确率：在金融文本情感分析任务中，准确率可达 81% - 82%。

📦 安装指南

无具体安装命令，跳过此章节。

💻 使用示例

基础用法

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

# Load the tokenizer used during fine-tuning
tokenizer = AutoTokenizer.from_pretrained('yiyanghkust/finbert-pretrain')

# Load the fine-tuned model
model_path = "likith123/SSAF-FinBert"
model = AutoModelForSequenceClassification.from_pretrained(model_path)

# Define a function for sentiment prediction
def predict_sentiment(input_text):
    # Tokenize the input text
    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True, max_length=512)

    # Perform inference
    with torch.no_grad():
        outputs = model(**inputs)

    # Get predicted probabilities for each class
    predicted_probs = torch.softmax(outputs.logits, dim=1).squeeze().tolist()

    return predicted_probs

此代码加载了预训练的分词器和微调后的 SSAF - FinBert 模型。你可以使用 predict_sentiment 函数来分析金融文本数据的情感。

高级用法

# Example usage
text_data = "This is a positive news article about the stock market."
predicted_sentiment = predict_sentiment(text_data)
print(predicted_sentiment)

调用 predict_sentiment 函数，将金融文本数据作为输入，该函数将返回每个情感类别（积极、消极和中性）的预测概率。predicted_sentiment 变量将包含一个对应于每个情感类别的概率列表，让你能够分析输入文本中表达的情感。