H

Halong Embedding

由hiieu開發
專注於RAG(檢索增強生成)和生產效率的越南語文本嵌入模型,基於intfloat/multilingual-e5-base微調
下載量 7,651
發布時間 : 7/6/2024

模型概述

Halong Embedding是一款基於intfloat/multilingual-e5-base微調的sentence-transformers模型,專注于越南語文本嵌入,支持語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

Matryoshka嵌入
採用Matryoshka損失函數訓練,允許截斷嵌入向量而性能損失最小,提供更快的比較速度。
多語言支持
以越南語為主,同時支持多語言處理。
高效檢索
專注於RAG(檢索增強生成)和生產效率,優化了信息檢索性能。

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
聚類分析

使用案例

信息檢索
法律文檔檢索
在Zalo法律檢索數據集上評估模型性能,用於快速查找相關法律文檔。
準確率@1達到0.8294,準確率@10達到0.9687
健康領域問答
健康益處查詢
檢索與健康益處相關的足球信息。
相關文檔按餘弦相似度排序,最高相似度0.7318
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase