Finbert Tone Finetuned Finance Topic Classification
基於Twitter金融新聞主題數據集微調的金融推文主題分類模型,支持20種金融主題分類。
下載量 2,813
發布時間 : 12/30/2022
模型概述
該模型用於對金融相關推文進行主題分類,涵蓋20種不同主題。針對類別標籤分佈不均衡問題進行了權重調整,提升整體性能。
模型特點
多主題分類
能夠對給定推文在20個不同金融主題中進行分類。
性能優化
針對類別標籤分佈不平衡問題調整權重,更關注樣本較少的標籤,提升整體性能。
模型能力
金融文本分類
推文主題識別
多標籤分類
使用案例
金融信息分析
金融新聞分類
對金融相關推文進行自動主題分類
準確率91.06%,F1值91.06%
市場情緒分析
識別推文中討論的金融主題,輔助市場情緒分析
🚀 finbert-tone微調金融主題分類模型
本模型是基於Twitter金融新聞主題數據集,對yiyanghkust/finbert-tone模型進行微調後的版本。它能夠有效對金融相關推文進行主題分類,為金融信息的快速篩選和分析提供有力支持。
🚀 快速開始
此模型可直接用於對金融推文進行主題分類,你可以參考Hugging Face相關文檔進行部署和使用。
✨ 主要特性
- 多主題分類:能夠對給定推文在20個不同金融主題中進行分類。
- 性能優化:考慮到類別標籤分佈不平衡,對權重進行了調整,更關注樣本較少的標籤,從而提升整體性能。
📚 詳細文檔
模型描述
該模型用於確定給定推文的金融主題,涵蓋20種不同主題。鑑於類別標籤分佈不均衡,對權重進行了調整,以關注樣本較少的標籤,這有助於提高整體性能。
預期用途與限制
目前關於預期用途和限制的詳細信息暫未提供。
訓練和評估數據
目前關於訓練和評估數據的詳細信息暫未提供。
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
屬性 | 詳情 |
---|---|
學習率 | 2e - 05 |
訓練批次大小 | 64 |
評估批次大小 | 64 |
隨機種子 | 42 |
優化器 | Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08) |
學習率調度器類型 | 線性 |
訓練輪數 | 20 |
混合精度訓練 | 原生自動混合精度(Native AMP) |
訓練結果
訓練損失 | 輪數 | 步數 | 驗證損失 | 準確率 | F1值 | 精確率 | 召回率 |
---|---|---|---|---|---|---|---|
無記錄 | 1.0 | 266 | 0.5152 | 0.8552 | 0.8504 | 0.8508 | 0.8552 |
0.7618 | 2.0 | 532 | 0.3999 | 0.8790 | 0.8781 | 0.8842 | 0.8790 |
0.7618 | 3.0 | 798 | 0.3628 | 0.8943 | 0.8940 | 0.8958 | 0.8943 |
0.16 | 4.0 | 1064 | 0.3776 | 0.8997 | 0.9001 | 0.9025 | 0.8997 |
0.16 | 5.0 | 1330 | 0.4286 | 0.8999 | 0.9002 | 0.9022 | 0.8999 |
0.058 | 6.0 | 1596 | 0.4500 | 0.9043 | 0.9042 | 0.9055 | 0.9043 |
0.058 | 7.0 | 1862 | 0.4689 | 0.9021 | 0.9017 | 0.9026 | 0.9021 |
0.0267 | 8.0 | 2128 | 0.4918 | 0.9031 | 0.9029 | 0.9039 | 0.9031 |
0.0267 | 9.0 | 2394 | 0.5030 | 0.9048 | 0.9049 | 0.9060 | 0.9048 |
0.0177 | 10.0 | 2660 | 0.5052 | 0.9033 | 0.9034 | 0.9044 | 0.9033 |
0.0177 | 11.0 | 2926 | 0.5265 | 0.9036 | 0.9034 | 0.9055 | 0.9036 |
0.013 | 12.0 | 3192 | 0.5267 | 0.9041 | 0.9041 | 0.9058 | 0.9041 |
0.013 | 13.0 | 3458 | 0.5090 | 0.9106 | 0.9106 | 0.9113 | 0.9106 |
0.0105 | 14.0 | 3724 | 0.5315 | 0.9067 | 0.9067 | 0.9080 | 0.9067 |
0.0105 | 15.0 | 3990 | 0.5339 | 0.9084 | 0.9084 | 0.9093 | 0.9084 |
0.0068 | 16.0 | 4256 | 0.5414 | 0.9072 | 0.9074 | 0.9088 | 0.9072 |
0.0051 | 17.0 | 4522 | 0.5460 | 0.9092 | 0.9091 | 0.9102 | 0.9092 |
0.0051 | 18.0 | 4788 | 0.5438 | 0.9072 | 0.9073 | 0.9081 | 0.9072 |
0.0035 | 19.0 | 5054 | 0.5474 | 0.9072 | 0.9073 | 0.9080 | 0.9072 |
0.0035 | 20.0 | 5320 | 0.5484 | 0.9079 | 0.9080 | 0.9087 | 0.9079 |
框架版本
- Transformers 4.25.1
- Pytorch 1.13.0+cu116
- Datasets 2.8.0
- Tokenizers 0.13.2
評估指標
該模型在評估集上取得了以下結果:
指標 | 值 |
---|---|
損失 | 0.509021 |
準確率 | 0.910615 |
F1值 | 0.910647 |
精確率 | 0.911335 |
召回率 | 0.910615 |
模型索引
模型名稱 | 任務 | 數據集 | 指標 |
---|---|---|---|
finbert - tone - finetuned - finance - topic - classification | 文本分類 | twitter - financial - news - topic | F1: 0.910647,準確率: 0.910615 |
示例
以下是一些示例推文及其對應的主題:
示例推文 | 主題 |
---|---|
Here are Thursday's biggest analyst calls: Apple, Amazon, Tesla, Palantir, DocuSign, Exxon & more | 分析師更新 |
LIVE: ECB surprises with 50bps hike, ending its negative rate era. President Christine Lagarde is taking questions | 美聯儲與央行 |
Goldman Sachs traders countered the industry’s underwriting slump with revenue gains that raced past analysts’ estimates. The trading operation posted a 32% surge in second - quarter revenue that included another banner period for fixed income | 公司與產品新聞 |
China Evergrande Group’s onshore bond holders rejected a plan by the distressed developer to further extend a bond payment which was due on Friday. Rebecca Choong Wilkins reports on Bloomberg Television | 國債與企業債務 |
Investing Club: Morgan Stanley's dividend, buyback pay us for our patience after quarterly missteps | 股息 |
Investing Club: Our takes on Amazon and Apple heading into next week's earnings reports | 收益報告 |
JUST RELEASED: Oil Price Dynamics Report → Over the past week, oil prices decreased as supply expectations rose and anticipated demand remained unchanged. | 能源與石油 |
Delta Air Lines fell short of profit expectations in the second quarter and said high operating costs will persist through the rest of the year. Bloomberg Opinion's Brooke Sutherland has more on 'Bloomberg Markets' | 財務狀況 |
BREAKING: The Indian rupee plummets to a record 80 per US dollar as foreign investors pull out money from the nation's stocks | 貨幣 |
Twitter and Elon Musk are now in a high stakes/high risk situation, one analyst said. | 綜合新聞與觀點 |
Copper prices are signaling that investors are bearish on the economy, strategist says | 黃金、金屬與材料 |
Johnson & Johnson CFO Joe Wolk says the company is positioned for the long term and the plans for its consumer operations include an IPO. He speaks on 'Bloomberg Markets' | 首次公開募股 |
Company and Elon Musk are set for a blockbuster courtroom battle over Musk’s attempt to terminate his $44 billion acquisition deal for $TWTR, according to Wedbush analyst Dan Ives. | 法律與監管 |
Amazon to buy primary health care provider One Medical for roughly $3.9 billion | 併購與投資 |
Barclays Senior Analyst For Equity Research Jason Goldberg: 'Price expectations have changed.'' The global markets business recorded $6.47 billion of revenue in the quarter with rates, commodities and currencies helping drive the fixed - income gains. | 宏觀經濟 |
US stocks push higher in a volatile session. We break it down on The Countdown to The Close | 市場行情 |
Zelenskyy fires security chiefs over ‘treasonous’ officials | 政治 |
Airbnb co - founder Joe Gebbia is stepping down | 人事變動 |
French power group EDF requests its shares be suspended | 股票評論 |
JUST IN: Alibaba shares slide as much as 5.7%, bringing this week's slump to over 15%, after it reportedly faced a data - theft inquiry | 股票走勢 |
Distilbert Base Uncased Finetuned Sst 2 English
Apache-2.0
基於DistilBERT-base-uncased在SST-2情感分析數據集上微調的文本分類模型,準確率91.3%
文本分類 英語
D
distilbert
5.2M
746
Xlm Roberta Base Language Detection
MIT
基於XLM-RoBERTa的多語言檢測模型,支持20種語言的文本分類
文本分類
Transformers 支持多種語言

X
papluca
2.7M
333
Roberta Hate Speech Dynabench R4 Target
該模型通過動態生成數據集來改進在線仇恨檢測,專注於從最差案例中學習以提高檢測效果。
文本分類
Transformers 英語

R
facebook
2.0M
80
Bert Base Multilingual Uncased Sentiment
MIT
基於bert-base-multilingual-uncased微調的多語言情感分析模型,支持6種語言的商品評論情感分析
文本分類 支持多種語言
B
nlptown
1.8M
371
Emotion English Distilroberta Base
基於DistilRoBERTa-base微調的英文文本情感分類模型,可預測埃克曼六種基本情緒及中性類別。
文本分類
Transformers 英語

E
j-hartmann
1.1M
402
Robertuito Sentiment Analysis
基於RoBERTuito的西班牙語推文情感分析模型,支持POS(積極)/NEG(消極)/NEU(中性)三類情感分類
文本分類 西班牙語
R
pysentimiento
1.0M
88
Finbert Tone
FinBERT是一款基於金融通訊文本預訓練的BERT模型,專注於金融自然語言處理領域。finbert-tone是其微調版本,用於金融情感分析任務。
文本分類
Transformers 英語

F
yiyanghkust
998.46k
178
Roberta Base Go Emotions
MIT
基於RoBERTa-base的多標籤情感分類模型,在go_emotions數據集上訓練,支持28種情感標籤識別。
文本分類
Transformers 英語

R
SamLowe
848.12k
565
Xlm Emo T
XLM-EMO是一個基於XLM-T模型微調的多語言情感分析模型,支持19種語言,專門針對社交媒體文本的情感預測。
文本分類
Transformers 其他

X
MilaNLProc
692.30k
7
Deberta V3 Base Mnli Fever Anli
MIT
基於MultiNLI、Fever-NLI和ANLI數據集訓練的DeBERTa-v3模型,擅長零樣本分類和自然語言推理任務
文本分類
Transformers 英語

D
MoritzLaurer
613.93k
204
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98