M

M ST5

由pkshatech開發
m-ST5是基於mT5編碼器構建的多語言句子嵌入模型,專為跨語言語義文本相似性和句子檢索任務優化。
下載量 30
發布時間 : 6/26/2023

模型概述

該模型是句子T5的多語言擴展版本,用於生成高質量的句子嵌入,支持跨語言語義文本相似性比較和句子檢索。

模型特點

多語言支持
基於mT5架構,支持多種語言的句子嵌入生成。
高效微調
使用LoRA技術進行適配,實現高效參數微調。
高性能
在跨語言語義文本相似性和句子檢索任務中表現優於LaBSE等基準模型。

模型能力

跨語言句子嵌入生成
語義文本相似性計算
跨語言句子檢索

使用案例

跨語言信息檢索
多語言文檔檢索
在不同語言的文檔集合中查找語義相似的句子。
在BUCC任務中達到97.6的準確率
語義相似性分析
跨語言文本相似性評估
比較不同語言文本之間的語義相似度。
在XSTS任務中優於LaBSE模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase