V

Vbert 2021 Large

由VMware開發
VMware研發的定製化BERT模型,針對技術文檔和專有術語優化
下載量 14
發布時間 : 5/11/2022

模型概述

基於BERT-large架構的預訓練語言模型,專門優化了VMware領域術語處理能力

模型特點

領域術語優化
替換詞彙表中1000個未使用標記為VMware專有術語(如Tanzu、vSphere等)
複合詞處理增強
改進對技術複合詞的分詞和處理能力
增量訓練
在原始BERT-large基礎上進行66,000步領域適應訓練

模型能力

文本理解
信息檢索
文本分類
技術術語處理

使用案例

企業技術文檔處理
技術文檔分類
對VMware產品文檔進行自動分類
性能優於標準BERT-base模型
知識庫檢索
增強企業知識庫的語義搜索能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase