🚀 bert-keyword-extractor
本模型是在未知數據集上對 bert-base-cased 進行微調後的版本。它可從文本中提取關鍵詞,為信息檢索和文本分析提供支持,有助於用戶快速定位關鍵信息。
📚 詳細文檔
模型信息
該模型是 bert-base-cased 的微調版本,在評估集上取得了以下結果:
- 損失值:0.1341
- 精確率:0.8565
- 召回率:0.8874
- 準確率:0.9738
- F1值:0.8717
訓練和評估數據
文檔未提供訓練和評估數據的詳細信息。
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
- 學習率:2e-05
- 訓練批次大小:16
- 評估批次大小:16
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e-08)
- 學習率調度器類型:線性
- 訓練輪數:8
- 混合精度訓練:Native AMP
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
精確率 |
召回率 |
準確率 |
F1值 |
0.1688 |
1.0 |
1875 |
0.1233 |
0.7194 |
0.7738 |
0.9501 |
0.7456 |
0.1219 |
2.0 |
3750 |
0.1014 |
0.7724 |
0.8166 |
0.9606 |
0.7939 |
0.0834 |
3.0 |
5625 |
0.0977 |
0.8280 |
0.8263 |
0.9672 |
0.8272 |
0.0597 |
4.0 |
7500 |
0.0984 |
0.8304 |
0.8680 |
0.9704 |
0.8488 |
0.0419 |
5.0 |
9375 |
0.1042 |
0.8417 |
0.8687 |
0.9717 |
0.8550 |
0.0315 |
6.0 |
11250 |
0.1161 |
0.8520 |
0.8839 |
0.9729 |
0.8677 |
0.0229 |
7.0 |
13125 |
0.1282 |
0.8469 |
0.8939 |
0.9734 |
0.8698 |
0.0182 |
8.0 |
15000 |
0.1341 |
0.8565 |
0.8874 |
0.9738 |
0.8717 |
框架版本
- Transformers 4.19.2
- Pytorch 1.11.0+cu113
- Datasets 2.2.2
- Tokenizers 0.12.1
📄 許可證
本模型採用 Apache-2.0 許可證。
🔍 模型標籤
- 由訓練器生成
- 評估指標:精確率、召回率、準確率、F1值
📊 模型小部件示例
- 文本:“博通同意以 610 億美元(570 億歐元)的現金加股票交易收購雲計算公司 VMware,這極大地拓展了這家芯片製造商的業務,使其軟件相關收入幾乎增長兩倍,佔總銷售額的約 45%。具體情況如下:VMware 股東每持有一股 VMware 股票,將獲得 142.50 美元現金或 0.2520 股博通股票。博通還將承擔 VMware 80 億美元的淨債務。”
- 文本:“加拿大自然資源部長喬納森·威爾金森告訴彭博社,加拿大可以在短短三年內開始向歐洲供應液化天然氣(LNG),方法是將加拿大東海岸現有的一個 LNG 進口設施改造成出口終端。關鍵信息:威爾金森表示,加拿大關心的是新的 LNG 設施採用低排放的天然氣加工工藝,並能夠在未來過渡到出口氫氣。”
- 文本:“谷歌正因在‘廣告技術棧’(即促進廣告商和賣家之間在線廣告位銷售的一系列服務)中的主導地位而受到英國反壟斷監管機構的調查。谷歌在廣告技術棧的各個層面都佔據強勢地位,並向發佈商和廣告商收取費用。相關背景:英國競爭與市場管理局也在調查谷歌和 Meta 是否在廣告業務上存在勾結,對兩家公司代號為‘絕地藍’的廣告協議進行了調查。”
- 文本:“美國證券交易委員會(SEC)的 13D 文件顯示,埃隆·馬斯克承諾額外投入 62.5 億美元自有資金,為 440 億美元的收購交易提供資金,使總出資額從最初的 272.5 億美元增至 335 億美元。消息公佈後,推特股價收盤上漲 6.35%。其他消息:推特前首席執行官傑克·多爾西宣佈將卸任,但將繼續留在推特董事會,‘直到他在 2022 年股東大會上的任期結束’。”