Finbert Tone Finetuned Finance Topic Classification
基于Twitter金融新闻主题数据集微调的金融推文主题分类模型,支持20种金融主题分类。
下载量 2,813
发布时间 : 12/30/2022
模型简介
该模型用于对金融相关推文进行主题分类,涵盖20种不同主题。针对类别标签分布不均衡问题进行了权重调整,提升整体性能。
模型特点
多主题分类
能够对给定推文在20个不同金融主题中进行分类。
性能优化
针对类别标签分布不平衡问题调整权重,更关注样本较少的标签,提升整体性能。
模型能力
金融文本分类
推文主题识别
多标签分类
使用案例
金融信息分析
金融新闻分类
对金融相关推文进行自动主题分类
准确率91.06%,F1值91.06%
市场情绪分析
识别推文中讨论的金融主题,辅助市场情绪分析
🚀 finbert-tone微调金融主题分类模型
本模型是基于Twitter金融新闻主题数据集,对yiyanghkust/finbert-tone模型进行微调后的版本。它能够有效对金融相关推文进行主题分类,为金融信息的快速筛选和分析提供有力支持。
🚀 快速开始
此模型可直接用于对金融推文进行主题分类,你可以参考Hugging Face相关文档进行部署和使用。
✨ 主要特性
- 多主题分类:能够对给定推文在20个不同金融主题中进行分类。
- 性能优化:考虑到类别标签分布不平衡,对权重进行了调整,更关注样本较少的标签,从而提升整体性能。
📚 详细文档
模型描述
该模型用于确定给定推文的金融主题,涵盖20种不同主题。鉴于类别标签分布不均衡,对权重进行了调整,以关注样本较少的标签,这有助于提高整体性能。
预期用途与限制
目前关于预期用途和限制的详细信息暂未提供。
训练和评估数据
目前关于训练和评估数据的详细信息暂未提供。
训练过程
训练超参数
训练过程中使用了以下超参数:
属性 | 详情 |
---|---|
学习率 | 2e - 05 |
训练批次大小 | 64 |
评估批次大小 | 64 |
随机种子 | 42 |
优化器 | Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08) |
学习率调度器类型 | 线性 |
训练轮数 | 20 |
混合精度训练 | 原生自动混合精度(Native AMP) |
训练结果
训练损失 | 轮数 | 步数 | 验证损失 | 准确率 | F1值 | 精确率 | 召回率 |
---|---|---|---|---|---|---|---|
无记录 | 1.0 | 266 | 0.5152 | 0.8552 | 0.8504 | 0.8508 | 0.8552 |
0.7618 | 2.0 | 532 | 0.3999 | 0.8790 | 0.8781 | 0.8842 | 0.8790 |
0.7618 | 3.0 | 798 | 0.3628 | 0.8943 | 0.8940 | 0.8958 | 0.8943 |
0.16 | 4.0 | 1064 | 0.3776 | 0.8997 | 0.9001 | 0.9025 | 0.8997 |
0.16 | 5.0 | 1330 | 0.4286 | 0.8999 | 0.9002 | 0.9022 | 0.8999 |
0.058 | 6.0 | 1596 | 0.4500 | 0.9043 | 0.9042 | 0.9055 | 0.9043 |
0.058 | 7.0 | 1862 | 0.4689 | 0.9021 | 0.9017 | 0.9026 | 0.9021 |
0.0267 | 8.0 | 2128 | 0.4918 | 0.9031 | 0.9029 | 0.9039 | 0.9031 |
0.0267 | 9.0 | 2394 | 0.5030 | 0.9048 | 0.9049 | 0.9060 | 0.9048 |
0.0177 | 10.0 | 2660 | 0.5052 | 0.9033 | 0.9034 | 0.9044 | 0.9033 |
0.0177 | 11.0 | 2926 | 0.5265 | 0.9036 | 0.9034 | 0.9055 | 0.9036 |
0.013 | 12.0 | 3192 | 0.5267 | 0.9041 | 0.9041 | 0.9058 | 0.9041 |
0.013 | 13.0 | 3458 | 0.5090 | 0.9106 | 0.9106 | 0.9113 | 0.9106 |
0.0105 | 14.0 | 3724 | 0.5315 | 0.9067 | 0.9067 | 0.9080 | 0.9067 |
0.0105 | 15.0 | 3990 | 0.5339 | 0.9084 | 0.9084 | 0.9093 | 0.9084 |
0.0068 | 16.0 | 4256 | 0.5414 | 0.9072 | 0.9074 | 0.9088 | 0.9072 |
0.0051 | 17.0 | 4522 | 0.5460 | 0.9092 | 0.9091 | 0.9102 | 0.9092 |
0.0051 | 18.0 | 4788 | 0.5438 | 0.9072 | 0.9073 | 0.9081 | 0.9072 |
0.0035 | 19.0 | 5054 | 0.5474 | 0.9072 | 0.9073 | 0.9080 | 0.9072 |
0.0035 | 20.0 | 5320 | 0.5484 | 0.9079 | 0.9080 | 0.9087 | 0.9079 |
框架版本
- Transformers 4.25.1
- Pytorch 1.13.0+cu116
- Datasets 2.8.0
- Tokenizers 0.13.2
评估指标
该模型在评估集上取得了以下结果:
指标 | 值 |
---|---|
损失 | 0.509021 |
准确率 | 0.910615 |
F1值 | 0.910647 |
精确率 | 0.911335 |
召回率 | 0.910615 |
模型索引
模型名称 | 任务 | 数据集 | 指标 |
---|---|---|---|
finbert - tone - finetuned - finance - topic - classification | 文本分类 | twitter - financial - news - topic | F1: 0.910647,准确率: 0.910615 |
示例
以下是一些示例推文及其对应的主题:
示例推文 | 主题 |
---|---|
Here are Thursday's biggest analyst calls: Apple, Amazon, Tesla, Palantir, DocuSign, Exxon & more | 分析师更新 |
LIVE: ECB surprises with 50bps hike, ending its negative rate era. President Christine Lagarde is taking questions | 美联储与央行 |
Goldman Sachs traders countered the industry’s underwriting slump with revenue gains that raced past analysts’ estimates. The trading operation posted a 32% surge in second - quarter revenue that included another banner period for fixed income | 公司与产品新闻 |
China Evergrande Group’s onshore bond holders rejected a plan by the distressed developer to further extend a bond payment which was due on Friday. Rebecca Choong Wilkins reports on Bloomberg Television | 国债与企业债务 |
Investing Club: Morgan Stanley's dividend, buyback pay us for our patience after quarterly missteps | 股息 |
Investing Club: Our takes on Amazon and Apple heading into next week's earnings reports | 收益报告 |
JUST RELEASED: Oil Price Dynamics Report → Over the past week, oil prices decreased as supply expectations rose and anticipated demand remained unchanged. | 能源与石油 |
Delta Air Lines fell short of profit expectations in the second quarter and said high operating costs will persist through the rest of the year. Bloomberg Opinion's Brooke Sutherland has more on 'Bloomberg Markets' | 财务状况 |
BREAKING: The Indian rupee plummets to a record 80 per US dollar as foreign investors pull out money from the nation's stocks | 货币 |
Twitter and Elon Musk are now in a high stakes/high risk situation, one analyst said. | 综合新闻与观点 |
Copper prices are signaling that investors are bearish on the economy, strategist says | 黄金、金属与材料 |
Johnson & Johnson CFO Joe Wolk says the company is positioned for the long term and the plans for its consumer operations include an IPO. He speaks on 'Bloomberg Markets' | 首次公开募股 |
Company and Elon Musk are set for a blockbuster courtroom battle over Musk’s attempt to terminate his $44 billion acquisition deal for $TWTR, according to Wedbush analyst Dan Ives. | 法律与监管 |
Amazon to buy primary health care provider One Medical for roughly $3.9 billion | 并购与投资 |
Barclays Senior Analyst For Equity Research Jason Goldberg: 'Price expectations have changed.'' The global markets business recorded $6.47 billion of revenue in the quarter with rates, commodities and currencies helping drive the fixed - income gains. | 宏观经济 |
US stocks push higher in a volatile session. We break it down on The Countdown to The Close | 市场行情 |
Zelenskyy fires security chiefs over ‘treasonous’ officials | 政治 |
Airbnb co - founder Joe Gebbia is stepping down | 人事变动 |
French power group EDF requests its shares be suspended | 股票评论 |
JUST IN: Alibaba shares slide as much as 5.7%, bringing this week's slump to over 15%, after it reportedly faced a data - theft inquiry | 股票走势 |
Distilbert Base Uncased Finetuned Sst 2 English
Apache-2.0
基于DistilBERT-base-uncased在SST-2情感分析数据集上微调的文本分类模型,准确率91.3%
文本分类 英语
D
distilbert
5.2M
746
Xlm Roberta Base Language Detection
MIT
基于XLM-RoBERTa的多语言检测模型,支持20种语言的文本分类
文本分类
Transformers 支持多种语言

X
papluca
2.7M
333
Roberta Hate Speech Dynabench R4 Target
该模型通过动态生成数据集来改进在线仇恨检测,专注于从最差案例中学习以提高检测效果。
文本分类
Transformers 英语

R
facebook
2.0M
80
Bert Base Multilingual Uncased Sentiment
MIT
基于bert-base-multilingual-uncased微调的多语言情感分析模型,支持6种语言的商品评论情感分析
文本分类 支持多种语言
B
nlptown
1.8M
371
Emotion English Distilroberta Base
基于DistilRoBERTa-base微调的英文文本情感分类模型,可预测埃克曼六种基本情绪及中性类别。
文本分类
Transformers 英语

E
j-hartmann
1.1M
402
Robertuito Sentiment Analysis
基于RoBERTuito的西班牙语推文情感分析模型,支持POS(积极)/NEG(消极)/NEU(中性)三类情感分类
文本分类 西班牙语
R
pysentimiento
1.0M
88
Finbert Tone
FinBERT是一款基于金融通讯文本预训练的BERT模型,专注于金融自然语言处理领域。finbert-tone是其微调版本,用于金融情感分析任务。
文本分类
Transformers 英语

F
yiyanghkust
998.46k
178
Roberta Base Go Emotions
MIT
基于RoBERTa-base的多标签情感分类模型,在go_emotions数据集上训练,支持28种情感标签识别。
文本分类
Transformers 英语

R
SamLowe
848.12k
565
Xlm Emo T
XLM-EMO是一个基于XLM-T模型微调的多语言情感分析模型,支持19种语言,专门针对社交媒体文本的情感预测。
文本分类
Transformers 其他

X
MilaNLProc
692.30k
7
Deberta V3 Base Mnli Fever Anli
MIT
基于MultiNLI、Fever-NLI和ANLI数据集训练的DeBERTa-v3模型,擅长零样本分类和自然语言推理任务
文本分类
Transformers 英语

D
MoritzLaurer
613.93k
204
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98