D

Dek21 Hcmute Embedding

由huyydangg開發
專注於RAG和生產效率的越南語文本嵌入模型,在10萬條法律問題數據集上訓練
下載量 696
發布時間 : 1/25/2025

模型概述

該模型是一個越南語句子轉換器模型,專門用於法律文本的相似度計算和信息檢索,採用俄羅斯套娃損失訓練以提高效率。

模型特點

俄羅斯套娃損失訓練
允許以最小性能損失截斷嵌入向量,使較小嵌入向量能更快進行比較,提高生產效率
法律領域優化
在約10萬條法律問題及其相關上下文的內部數據集上進行訓練,特別適合法律文本處理
高效向量比較
支持多種維度(768/512/256/128/64)的嵌入向量,可根據性能需求靈活選擇

模型能力

法律文本相似度計算
法律信息檢索
法律條款匹配
越南語文本特徵提取

使用案例

法律信息檢索
法律條款匹配
匹配用戶查詢與相關法律條款
在測試數據集上達到0.5856的餘弦準確率@1
法律問答系統
構建基於法律知識的問答系統
在VMTEB-Zalo-legel-retrieval-wseg數據集上ndcg@3達到0.9084
法律文檔處理
法律文檔分類
對法律文檔進行自動分類
法律文檔聚類
將相似法律文檔自動聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase