SSAF-FinBert開源模型 - 精準分類金融文本情感，助力股票市場新聞分析

首頁

SSAF FinBert

由likith123開發

SSAF-FinBert是基於FinBert微調的股票市場新聞情感分析模型，能分類金融文本為積極、消極和中性三類情感。

文本分類

Transformers

開源協議:MIT #金融情感分析 #股票新聞分類 #高準確率(82%)

下載量 69

發布時間 : 3/4/2024

模型概述

該模型專為金融文本情感分析設計，在Kaggle數據集上微調，準確率達81%-82%。

模型特點

金融領域優化

專門針對股票市場新聞文章進行微調，優化了金融術語的理解能力

三分類情感分析

能將文本情感準確分類為積極、消極和中性三類

高準確率

在不同訓練平臺上達到81%-82%的準確率

模型能力

金融文本情感分類

股票新聞情緒分析

三分類概率預測

使用案例

金融分析

股票新聞情緒監測

分析股票相關新聞的情緒傾向，輔助投資決策

準確率81%-82%

市場情緒分析

追蹤市場整體情緒變化，預測市場趨勢

🚀 模型卡片：SSAF - FinBert

SSAF - FinBert 模型是 FinBert 模型的微調版本，專為股票市場新聞文章的情感分析而設計。它能夠將金融文本數據中表達的情感分為積極、消極和中性三類。

🚀 快速開始

本模型是在從 Kaggle 收集的數據集上進行訓練的。經過預處理後，使用 FinBert 架構在 GPU 集群上進行了大約 5 小時的微調。根據訓練所用的平臺，最終模型的準確率在 81% 至 82% 之間。

✨ 主要特性

情感分類：可將金融文本情感精準分為積極、消極和中性三類。
高準確率：在金融文本情感分析任務中，準確率可達 81% - 82%。

📦 安裝指南

無具體安裝命令，跳過此章節。

💻 使用示例

基礎用法

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

# Load the tokenizer used during fine-tuning
tokenizer = AutoTokenizer.from_pretrained('yiyanghkust/finbert-pretrain')

# Load the fine-tuned model
model_path = "likith123/SSAF-FinBert"
model = AutoModelForSequenceClassification.from_pretrained(model_path)

# Define a function for sentiment prediction
def predict_sentiment(input_text):
    # Tokenize the input text
    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True, max_length=512)

    # Perform inference
    with torch.no_grad():
        outputs = model(**inputs)

    # Get predicted probabilities for each class
    predicted_probs = torch.softmax(outputs.logits, dim=1).squeeze().tolist()

    return predicted_probs

此代碼加載了預訓練的分詞器和微調後的 SSAF - FinBert 模型。你可以使用 predict_sentiment 函數來分析金融文本數據的情感。

高級用法

# Example usage
text_data = "This is a positive news article about the stock market."
predicted_sentiment = predict_sentiment(text_data)
print(predicted_sentiment)

調用 predict_sentiment 函數，將金融文本數據作為輸入，該函數將返回每個情感類別（積極、消極和中性）的預測概率。predicted_sentiment 變量將包含一個對應於每個情感類別的概率列表，讓你能夠分析輸入文本中表達的情感。