🚀 模型卡片:SSAF - FinBert
SSAF - FinBert 模型是 FinBert 模型的微調版本,專為股票市場新聞文章的情感分析而設計。它能夠將金融文本數據中表達的情感分為積極、消極和中性三類。
🚀 快速開始
本模型是在從 Kaggle 收集的數據集上進行訓練的。經過預處理後,使用 FinBert 架構在 GPU 集群上進行了大約 5 小時的微調。根據訓練所用的平臺,最終模型的準確率在 81% 至 82% 之間。
✨ 主要特性
- 情感分類:可將金融文本情感精準分為積極、消極和中性三類。
- 高準確率:在金融文本情感分析任務中,準確率可達 81% - 82%。
📦 安裝指南
無具體安裝命令,跳過此章節。
💻 使用示例
基礎用法
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch
tokenizer = AutoTokenizer.from_pretrained('yiyanghkust/finbert-pretrain')
model_path = "likith123/SSAF-FinBert"
model = AutoModelForSequenceClassification.from_pretrained(model_path)
def predict_sentiment(input_text):
inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
predicted_probs = torch.softmax(outputs.logits, dim=1).squeeze().tolist()
return predicted_probs
此代碼加載了預訓練的分詞器和微調後的 SSAF - FinBert 模型。你可以使用 predict_sentiment
函數來分析金融文本數據的情感。
高級用法
text_data = "This is a positive news article about the stock market."
predicted_sentiment = predict_sentiment(text_data)
print(predicted_sentiment)
調用 predict_sentiment
函數,將金融文本數據作為輸入,該函數將返回每個情感類別(積極、消極和中性)的預測概率。predicted_sentiment
變量將包含一個對應於每個情感類別的概率列表,讓你能夠分析輸入文本中表達的情感。
📚 詳細文檔
標籤映射
- Label_0 = 消極
- Label_1 = 中性
- Label_2 = 積極
實際微調過程
🔧 技術細節
SSAF - FinBert 模型在與金融文本數據相關的情感分析任務中表現出色。不過,模型的準確率可能會因輸入文本的性質和複雜性而有所不同。雖然該模型在對金融新聞文章的情感分類方面表現優異,但在其他領域或處理高度專業化的金融術語時,可能無法達到最佳性能。
📄 許可證
本模型採用 MIT 許可證。
致謝
SSAF - FinBert 模型的開發得益於開源社區的貢獻以及 Hugging Face 提供的資源。我們感謝為基於 Transformer 的自然語言處理任務模型的開發和改進做出貢獻的開發者和研究人員。
如需獲取 SSAF - FinBert 模型的更多信息和更新,請參考 模型卡片。