S

Sec Bert Shape

由nlpaueb開發
面向金融領域的BERT變體,通過數值形態偽標記處理保持財務數據完整性
下載量 30
發布時間 : 3/2/2022

模型概述

專為金融文本設計的BERT模型,通過將數字轉換為形態偽標記(如'53.2'→'[XX.X]')優化財務數值處理,適用於10-K年報等金融文檔分析

模型特點

數值形態標準化
將數字統一轉換為214種預定義形態標記(如'[XX.X]'),避免數字碎片化問題
金融領域預訓練
基於26萬份SEC 10-K年報訓練,深度適配財務文本特徵
多版本適配
提供基礎版/數字版/形態版三種變體,滿足不同場景需求

模型能力

財務文本掩碼預測
金融數值形態識別
財務動詞預測
數值單位推斷

使用案例

財務報告分析
財務指標變化預測
預測年報中銷售額/利潤等指標的增減趨勢
在動詞預測任務中準確率較基礎BERT提升3倍
數值單位補全
自動補全財務數值的單位(百萬/十億等)
單位預測準確率>97%
監管文件處理
XBRL標記輔助
識別財務數值實體以輔助XBRL標記生成
相關技術已發表於ACL 2022論文
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase