kf - deberta - base開源金融語言模型 - 通用與金融任務表現出色助決策

首頁

Kf Deberta Base

由kakaobank開發

KF-DeBERTa是由KakaoBank與FNGuid聯合發佈的金融領域專用語言模型，基於DeBERTa-v2架構構建，在通用和金融領域下游任務中均表現優異。

大型語言模型

Transformers

韓語開源協議:MIT #金融領域優化 #多任務性能優越 #韓語專用模型

下載量 783

發布時間 : 12/13/2023

模型概述

KF-DeBERTa是一個同時訓練通用語料與金融領域語料的語言模型，在金融領域任務中經過多數據集嚴格驗證，在KLUE基準測試中表現優於RoBERTa-Large。

模型特點

金融領域優化

專門針對金融領域任務進行優化，在金融情感分析、命名實體識別等任務中表現優異

跨領域能力

同時訓練通用語料與金融領域語料，在通用領域和金融領域下游任務中均表現優異

性能優越

在KLUE基準測試中平均得分82.83，超越KLUE-RoBERTa大型版(82.43)

多任務支持

支持多種自然語言處理任務，包括文本分類、命名實體識別、關係抽取等

模型能力

金融文本理解

情感分析

命名實體識別

關係抽取

文本分類

問答系統

使用案例

金融分析

金融情感分析

分析金融文本中的情感傾向

在FN-情感分析(v1)任務中達到99.36%準確率

金融新聞分類

對金融新聞進行分類

在FN-金融新聞任務中達到97.63%準確率

通用NLP

文本分類

通用領域的文本分類任務

在NSMC任務中達到91.36%準確率

語義相似度

計算文本間的語義相似度

在KorSTS任務中達到85.99斯皮爾曼係數

🚀 KF-DeBERTa

KF-DeBERTa是由 KakaoBank 和 FNGuide 聯合訓練的金融領域專用語言模型。該模型結合了通用領域和金融領域的語料進行訓練，在多個下游任務中展現出卓越性能。

✨ 主要特性

多領域融合訓練：KF-DeBERTa 同時使用通用領域語料庫和金融領域語料庫進行訓練，在通用領域和金融領域的下游任務中均表現出色。
架構選擇：模型架構基於 DeBERTa-v2 進行訓練。由於觀察到使用 ELECTRA 的 RTD 作為訓練目標的 DeBERTa-v3 在部分任務（如 KLUE-RE、WoS、Retrieval）中性能較低，最終選擇了 DeBERTa-v2 作為架構。
優異性能：在通用領域和金融領域的下游任務中均驗證了其卓越性能。特別是在金融領域的下游任務中，通過多種數據集進行了全面的性能驗證，在 KLUE Benchmark 中表現優於 RoBERTa-Large。

📦 安裝指南

文檔未提供安裝步驟，如需使用該模型，可參考 Hugging Face 的 Transformers 庫的安裝方法。

💻 使用示例

基礎用法

from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("kakaobank/kf-deberta-base")
tokenizer = AutoTokenizer.from_pretrained("kakaobank/kf-deberta-base")

text = "카카오뱅크와 에프엔가이드가 금융특화 언어모델을 공개합니다."
tokens = tokenizer.tokenize(text)
print(tokens)

inputs = tokenizer(text, return_tensors="pt")
model_output = model(**inputs)
print(model_output)

📚 詳細文檔

基準測試

所有任務僅進行了以下基本的超參數搜索：

批量大小（batch size）: {16, 32}
學習率（learning_rate）: {1e-5, 3e-5, 5e-5}
權重衰減（weight_decay）: {0, 0.01}
預熱比例（warmup_proportion）: {0, 0.1}

KLUE 基準測試

模型	YNAT（F1）	KLUE-ST（Pearsonr/F1）	KLUE-NLI（ACC）	KLUE-NER（F1-Entity/F1-Char）	KLUE-RE（F1-micro/AUC）	KLUE-DP（UAS/LAS）	KLUE-MRC（EM/ROUGE）	WoS（JGA/F1-S）	平均
mBERT (Base)	82.64	82.97/75.93	72.90	75.56/88.81	58.39/56.41	88.53/86.04	49.96/55.57	35.27/88.60	71.26
XLM-R (Base)	84.52	88.88/81.20	78.23	80.48/92.14	57.62/57.05	93.12/87.23	26.76/53.36	41.54/89.81	72.28
XLM-R (Large)	87.30	93.08/87.17	86.40	82.18/93.20	58.75/63.53	92.87/87.82	35.23/66.55	42.44/89.88	76.17
KR-BERT (Base)	85.36	87.50/77.92	77.10	74.97/90.46	62.83/65.42	92.87/87.13	48.95/58.38	45.60/90.82	74.67
KoELECTRA (Base)	85.99	93.14/85.89	86.87	86.06/92.75	62.67/57.46	90.93/87.07	59.54/65.64	39.83/88.91	77.34
KLUE-BERT (Base)	86.95	91.01/83.44	79.87	83.71/91.17	65.58/68.11	93.07/87.25	62.42/68.15	46.72/91.59	78.50
KLUE-RoBERTa (Small)	85.95	91.70/85.42	81.00	83.55/91.20	61.26/60.89	93.47/87.50	58.25/63.56	46.65/91.50	77.28
KLUE-RoBERTa (Base)	86.19	92.91/86.78	86.30	83.81/91.09	66.73/68.11	93.75/87.77	69.56/74.64	47.41/91.60	80.48
KLUE-RoBERTa (Large)	85.88	93.20/86.13	89.50	84.54/91.45	71.06/73.33	93.84/87.93	75.26/80.30	49.39/92.19	82.43
KF-DeBERTa (Base)	87.51	93.24/87.73	88.37	89.17/93.30	69.70/75.07	94.05/87.97	72.59/78.08	50.21/92.59	82.83

注：粗體表示所有模型中的最高分數，下劃線表示基礎模型中的最高分數。

金融領域基準測試

模型	FN-Sentiment (v1)（ACC）	FN-Sentiment (v2)（ACC）	FN-Adnews（ACC）	FN-NER（F1-micro）	KorFPB（ACC）	KorFiQA-SA（MSE）	KorHeadline（Mean F1）	平均（除 FiQA-SA）
KLUE-RoBERTa (Base)	98.26	91.21	96.34	90.31	90.97	0.0589	81.11	94.03
KoELECTRA (Base)	98.26	90.56	96.98	89.81	92.36	0.0652	80.69	93.90
KF-DeBERTa (Base)	99.36	92.29	97.63	91.80	93.47	0.0553	82.12	95.27

FN-Sentiment：金融領域情感分析
FN-Adnews：金融領域廣告新聞分類
FN-NER：金融領域命名實體識別
KorFPB：FinancialPhraseBank 翻譯數據集
- 引用: Malo, Pekka, et al. "Good debt or bad debt: Detecting semantic orientations in economic texts." Journal of the Association for Information Science and Technology 65.4 (2014): 782-796.
KorFiQA-SA：FiQA-SA 翻譯數據集
- 引用: Maia, Macedo & Handschuh, Siegfried & Freitas, Andre & Davis, Brian & McDermott, Ross & Zarrouk, Manel & Balahur, Alexandra. (2018). WWW'18 Open Challenge: Financial Opinion Mining and Question Answering. WWW '18: Companion Proceedings of the The Web Conference 2018. 1941-1942. 10.1145/3184558.3192301.
KorHeadline：Gold Commodity News and Dimensions 翻譯數據集
- 引用: Sinha, A., & Khandait, T. (2021, April). Impact of News on the Commodity Market: Dataset and Results. In Future of Information and Communication Conference (pp. 589-601). Springer, Cham.

通用領域基準測試

模型	NSMC（ACC）	PAWS（ACC）	KorNLI（ACC）	KorSTS（spearman）	KorQuAD（EM/F1）	平均（除 KorQuAD）
KLUE-RoBERTa (Base)	90.47	84.79	81.65	84.40	86.34/94.40	85.33
KoELECTRA (Base)	90.63	84.45	82.24	85.53	84.83/93.45	85.71
KF-DeBERTa (Base)	91.36	86.14	84.54	85.99	86.60/95.07	87.01

📄 許可證

KF-DeBERTa 的源代碼和模型在 MIT 許可證下公開。許可證全文可在 MIT 文件中查看。本公司對因使用該模型而產生的任何損失不承擔責任。

🔗 引用

@proceedings{jeon-etal-2023-kfdeberta,
  title         = {KF-DeBERTa: Financial Domain-specific Pre-trained Language Model},
  author        = {Eunkwang Jeon, Jungdae Kim, Minsang Song, and Joohyun Ryu},
  booktitle     = {Proceedings of the 35th Annual Conference on Human and Cognitive Language Technology},
  moth          = {oct},
  year          = {2023},
  publisher     = {Korean Institute of Information Scientists and Engineers},
  url           = {http://www.hclt.kr/symp/?lnb=conference},
  pages         = {143--148},
}