G

Greennode Embedding Large VN V1

由GreenNode開發
這是一個針對越南語優化的句子嵌入模型,能夠將文本轉換為1024維向量,適用於語義相似度和檢索任務。
下載量 785
發布時間 : 4/11/2025

模型概述

基於XLM-RoBERTa架構的句子嵌入模型,專門針對越南語文本進行優化,支持語義相似度計算、文本檢索和聚類等任務。

模型特點

越南語優化
專門針對越南語文本訓練,在越南語檢索任務上表現優於通用多語言模型
長文本支持
支持最大8192個標記的序列長度,適合處理較長文檔
高性能檢索
在多個越南語檢索基準測試中表現優異,特別是在表格檢索任務上

模型能力

語義文本相似度計算
語義搜索
文本聚類
文本分類
複述挖掘

使用案例

信息檢索
法律文檔檢索
在法律文本庫中快速查找相關文檔
在Zac法律文本檢索數據集上達到74.95%的平均性能
表格數據檢索
從結構化表格數據中檢索相關信息
在GreenNode表格檢索數據集上達到46.23%的平均性能
問答系統
越南語問答
構建越南語問答系統的檢索組件
在VieQuAD數據集上達到56.86%的平均性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase