I

Intention

由leeloolee開發
GTE多語言基礎模型是一個密集的句子轉換器,支持多種語言的句子相似度計算和文本嵌入任務。
下載量 32
發布時間 : 9/7/2024

模型概述

該模型是一個多語言句子轉換器,專門設計用於處理多種語言的句子相似度計算和文本嵌入任務。它支持超過50種語言,適用於跨語言信息檢索、文本聚類和分類等應用場景。

模型特點

多語言支持
支持超過50種語言,適用於跨語言文本處理任務。
密集表示
採用密集轉換器架構,能夠生成高質量的句子嵌入表示。
多功能性
適用於多種自然語言處理任務,包括相似度計算、聚類、分類和信息檢索。

模型能力

句子相似度計算
文本嵌入生成
跨語言信息檢索
文本聚類
文本分類
雙語文本挖掘

使用案例

信息檢索
跨語言文檔檢索
使用該模型可以檢索不同語言的相關文檔。
在MTEB AlloprofRetrieval任務中達到53.638的NDCG@10分數
文本分類
情感分析
可用於多語言情感分類任務。
在MTEB AmazonPolarityClassification任務中達到80.72%的準確率
文本相似度
句子相似度計算
計算不同語言句子之間的語義相似度。
在MTEB BIOSSES任務中達到81.21的餘弦相似度Spearman相關係數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase