V

Vietnamese Embedding

由AITeamVN開發
基於BGE-M3微調的越南語嵌入模型,增強越南語檢索能力
下載量 14.26k
發布時間 : 3/17/2025

模型概述

Vietnamese_Embedding是基於BGE-M3模型微調的嵌入模型,專門針對越南語檢索任務優化,在約30萬組越南語查詢、正向文檔和負向文檔三元組上進行訓練。

模型特點

越南語優化
專門針對越南語檢索任務進行微調,提升越南語文本的嵌入質量
長文本支持
支持最大2048個標記的序列長度,適合處理長文檔
高性能
在法律文本檢索任務上表現優於基礎模型BGE-M3和其他越南語嵌入模型

模型能力

越南語文本嵌入
句子相似度計算
文檔檢索

使用案例

信息檢索
法律文檔檢索
在法律文本數據集上實現高準確率的文檔檢索
在Legal Zalo 2021數據集上Accuracy@1達到0.7274
通用文檔檢索
適用於各種越南語文檔的檢索任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase