SSAF-FinBertオープンソースモデル - 金融テキストの感情を正確に分類し、株式市場のニュース分析を支援

ホーム

SSAF FinBert

likith123によって開発

SSAF-FinBertはFinBertを微調整した株式市場ニュースの感情分析モデルで、金融テキストをポジティブ、ネガティブ、ニュートラルの3つの感情に分類できます。

テキスト分類

Transformers

オープンソースライセンス:MIT #金融感情分析 #株ニュース分類 #高精度(82%)

ダウンロード数 69

リリース時間 : 3/4/2024

モデル概要

このモデルは金融テキストの感情分析専用に設計され、Kaggleデータセットで微調整され、精度は81%-82%を達成しました。

モデル特徴

金融分野最適化

株式市場ニュース記事に特化して微調整され、金融用語の理解能力を最適化

3分類感情分析

テキスト感情を正確にポジティブ、ネガティブ、ニュートラルの3つに分類可能

高精度

異なるトレーニングプラットフォームで81%-82%の精度を達成

モデル能力

金融テキスト感情分類

株ニュース感情分析

3分類確率予測

使用事例

金融分析

株ニュース感情モニタリング

株関連ニュースの感情傾向を分析し、投資判断を支援

精度81%-82%

市場感情分析

市場全体の感情変化を追跡し、市場トレンドを予測

🚀 モデルカード: SSAF-FinBert

SSAF-FinBertモデルは、株式市場のニュース記事の感情分析を目的として、FinBertモデルをファインチューニングしたバージョンです。金融テキストデータに表現される感情を、ポジティブ、ネガティブ、ニュートラルの3つのカテゴリに分類するように最適化されています。

このモデルは、Kaggleから収集したデータセットを前処理し、GPUクラスター上でFinBertアーキテクチャを使って約5時間ファインチューニングされました。結果として得られたモデルは、トレーニングに使用したプラットフォームによって異なりますが、81%から82%の精度を達成しました。

推論APIのラベルマッピング:

Label_0 = ネガティブ

Label_1 = ニュートラル

Label_2 = ポジティブ

🚀 クイックスタート

モデルへのアクセス方法

感情分析のためにSSAF-FinBertモデルにアクセスするには、以下のPythonコードを使用できます。

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

# Load the tokenizer used during fine-tuning
tokenizer = AutoTokenizer.from_pretrained('yiyanghkust/finbert-pretrain')

# Load the fine-tuned model
model_path = "likith123/SSAF-FinBert"
model = AutoModelForSequenceClassification.from_pretrained(model_path)

# Define a function for sentiment prediction
def predict_sentiment(input_text):
    # Tokenize the input text
    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True, max_length=512)

    # Perform inference
    with torch.no_grad():
        outputs = model(**inputs)

    # Get predicted probabilities for each class
    predicted_probs = torch.softmax(outputs.logits, dim=1).squeeze().tolist()

    return predicted_probs

このコードは、事前学習済みのトークナイザーとファインチューニングされたSSAF-FinBertモデルをロードします。その後、predict_sentiment関数を使用して、金融テキストデータの感情を分析することができます。

モデルの使用方法

感情分析のためにSSAF-FinBertモデルを使用するには、金融テキストデータを入力としてpredict_sentiment関数を呼び出すことができます。この関数は、各感情クラス（ポジティブ、ネガティブ、ニュートラル）の予測確率を返します。

# Example usage
text_data = "This is a positive news article about the stock market."
predicted_sentiment = predict_sentiment(text_data)
print(predicted_sentiment)

predicted_sentiment変数には、各感情クラスに対応する確率のリストが含まれ、入力テキストに表現される感情を分析することができます。