G

Greennode Embedding Large VN Mixed V1

由GreenNode開發
這是一個基於sentence-transformers的越南語嵌入模型,支持英語和越南語,可將文本映射到1024維向量空間,用於語義相似度計算和檢索任務。
下載量 400
發布時間 : 4/11/2025

模型概述

該模型專門針對越南語優化,同時支持英語,適用於語義文本相似性、語義搜索、文本分類和聚類等任務。

模型特點

多語言支持
同時支持越南語和英語的文本嵌入
長文本處理
支持最大8192個標記的長文本序列
高性能檢索
在越南語文本檢索任務上表現優於同類模型
大向量空間
輸出1024維的密集向量表示

模型能力

語義文本相似度計算
語義搜索
文本分類
文本聚類
特徵提取

使用案例

信息檢索
法律文檔檢索
在法律文檔庫中檢索相關法律條文
在ZacLegalTextRetrieval數據集上達到74.95%的平均性能
表格數據檢索
從結構化表格中檢索相關信息
在GreenNodeTableRetrieval數據集上達到44.89%的平均性能
問答系統
越南語問答
構建越南語問答系統的檢索模塊
在VieQuADRetrieval數據集上達到56.86%的平均性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase