L

Labse En Ru

由cointegrated開發
基於LaBSE模型精簡的英語和俄語專用版本,保留原始嵌入質量的同時大幅減小模型體積
下載量 375.34k
發布時間 : 3/2/2022

模型概述

該模型是LaBSE的精簡版本,僅支持英語和俄語,詞彙量縮減至原版的10%,參數量保留27%,完全保持原始嵌入向量質量,適用於句子相似度計算等任務

模型特點

雙語專用精簡
僅保留英語和俄語詞元,詞彙量縮減至原版10%,模型體積大幅減小
質量無損壓縮
在縮減模型規模的同時,完全保持英語和俄語嵌入向量的原始質量
多語言適配方案
提供可適配其他語言組合的裁剪方案(參考提供的Colab筆記本)

模型能力

生成句子嵌入向量
計算句子相似度
支持英語和俄語文本處理

使用案例

文本相似度
跨語言文檔檢索
在英語和俄語文檔間建立語義關聯,實現跨語言檢索
保持與原始LaBSE相當的檢索準確率
雙語內容匹配
識別英語和俄語內容的語義對應關係
特徵提取
下游任務特徵輸入
為分類、聚類等任務提供預訓練嵌入特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase