T

Text2vec Base Multilingual

由barisaydin開發
一個支持多語言的文本向量化模型,專注於句子相似度計算和特徵提取任務
下載量 17
發布時間 : 9/20/2023

模型概述

該模型是一個多語言文本嵌入模型,能夠將不同語言的文本轉換為向量表示,主要用於句子相似度計算、文本分類和聚類等任務。支持包括中文、英文、德語、法語等多種語言。

模型特點

多語言支持
支持包括中文、英文、德語、法語等多種語言的文本向量化
句子相似度計算
專門優化用於計算不同句子之間的語義相似度
跨語言能力
能夠處理跨語言的文本相似度比較任務
高效特徵提取
可以快速提取文本的語義特徵表示

模型能力

文本向量化
句子相似度計算
跨語言文本比較
文本特徵提取
文本分類
文本聚類

使用案例

電子商務
多語言評論分類
對亞馬遜不同語言的商品評論進行分類
在MTEB亞馬遜多語言評論分類任務中,英文準確率33.13%,中文準確率32.52%
評論極性分析
分析商品評論的情感極性(正面/負面)
在MTEB亞馬遜極性分類任務中準確率達到66.10%
意圖識別
多語言意圖分類
識別用戶查詢的意圖類別
在MTEB MTOP意圖分類任務中,英文準確率62.79%,德語55.29%
學術研究
論文聚類
對學術論文進行主題聚類
在MTEB arXiv論文聚類P2P任務中V測量值32.32%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase