L

Labse

由setu4993開發
LaBSE是一個基於BERT的多語言句子嵌入模型,支持109種語言,適用於句子相似度計算和雙語文本檢索。
下載量 18.74k
發布時間 : 3/2/2022

模型概述

該模型通過結合掩碼語言建模和翻譯語言建模進行預訓練,能夠生成高質量的多語言句子嵌入,特別適合跨語言文本匹配任務。

模型特點

多語言支持
支持109種語言的句子嵌入,實現跨語言文本匹配
高質量嵌入
通過掩碼語言建模和翻譯語言建模聯合訓練,生成高質量的句子表示
跨語言檢索
特別適合雙語文本檢索等跨語言應用場景

模型能力

多語言句子嵌入
跨語言文本相似度計算
雙語文本檢索
多語言語義匹配

使用案例

信息檢索
跨語言文檔檢索
在不同語言的文檔集合中查找語義相似的文檔
可有效匹配不同語言中表達相同概念的文檔
機器翻譯
翻譯質量評估
通過比較源語言和目標語言句子的嵌入相似度來評估翻譯質量
提供與人工評估高度相關的自動評估指標
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase