V

Vbert 2021 Base

由VMware開發
VMware公司針對技術領域優化的BERT基礎模型,通過增量預訓練強化了對專有術語的處理能力
下載量 14
發布時間 : 5/11/2022

模型概述

基於BERT-base架構優化的領域專用語言模型,針對VMware技術文檔、博客等文本數據進行增量預訓練,顯著提升對專有詞彙和技術術語的理解能力

模型特點

專有詞彙優化
替換BERT詞彙表中前1000個未使用token為VMware專有術語(如Tanzu、vSphere等)
領域增量訓練
基於32萬篇VMware技術文檔進行增量預訓練(5個epoch)
複合詞處理增強
改進對技術領域常見覆合詞的分詞和語義理解能力

模型能力

技術文本理解
專有名詞識別
語義特徵提取
信息檢索增強

使用案例

企業知識管理
技術文檔檢索
在VMware知識庫中實現更精準的語義搜索
相比原始BERT模型提升檢索準確率
自動分類系統
對用戶提交的技術支持請求進行自動分類
減少人工標註工作量約40%
內容處理
技術文檔摘要
自動生成VMware產品文檔的摘要
關鍵信息保留率提升25%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase