G

Gte Multilingual Base

由Alibaba-NLP開發
GTE Multilingual Base 是一個多語言的句子嵌入模型,支持超過50種語言,適用於句子相似度計算等任務。
下載量 1.2M
發布時間 : 7/20/2024

模型概述

該模型是一個基於Transformer架構的多語言句子嵌入模型,能夠將不同語言的句子映射到統一的向量空間,便於跨語言句子相似度計算和信息檢索。

模型特點

多語言支持
支持超過50種語言的句子嵌入,實現跨語言語義理解
多功能任務適配
適用於句子相似度、聚類、分類、檢索等多種自然語言處理任務
高性能表現
在多個基準測試中展現出優秀的性能指標

模型能力

句子相似度計算
文本聚類
文本分類
信息檢索
文本重排序
雙語文本挖掘

使用案例

信息檢索
跨語言文檔檢索
在不同語言的文檔集合中檢索相關文檔
在AlloprofRetrieval測試中NDCG@10達到53.638
文本分類
產品評論分類
對多語言產品評論進行情感分類
在AmazonPolarityClassification中準確率達到80.72%
句子相似度
跨語言句子匹配
計算不同語言句子之間的語義相似度
在BIOSSES測試中Spearman相關係數達到81.21
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase