V

Vietnamese Bi Encoder

由bkai-foundation-models開發
這是一個基於PhoBERT-base-v2的句子轉換器模型,專為越南語文本的語義相似度任務設計。
下載量 30.46k
發布時間 : 9/9/2023

模型概述

該模型將越南語句子和段落映射到768維的密集向量空間,可用於聚類、語義搜索等自然語言處理任務。

模型特點

優化的越南語處理
基於PhoBERT-base-v2預訓練模型,專門針對越南語文本進行了優化
多數據集訓練
在MS Macro、SQuAD v2和Zalo法律文本檢索挑戰賽數據集上進行了訓練
高性能語義編碼
在Zalo法律文本檢索任務上表現出色,Acc@1達到73.28%

模型能力

句子嵌入
語義相似度計算
文本聚類
信息檢索

使用案例

法律文本檢索
法律文檔相似性搜索
在法律文檔庫中查找語義相似的文檔
在Zalo法律文本檢索挑戰賽上Acc@1達到73.28%
教育應用
教育內容檢索
在教育資源庫中查找相關的學習材料
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase