L

Lt Wikidata Comp Multi

由dell-research-harvard開發
基於sentence-transformers/paraphrase-multilingual-mpnet-base-v2微調的多語言句子相似度模型,支持12種語言的語義匹配任務
下載量 415
發布時間 : 8/29/2023

模型概述

該模型專為記錄鏈接(實體匹配)任務設計,可用於聚類、去重、關聯等場景,支持德語、英語、中文等12種語言的句子相似度計算

模型特點

多語言支持
支持12種主要語言的句子相似度計算,包括歐洲和亞洲主要語種
實體匹配優化
專門針對公司別名匹配等實體鏈接任務進行優化訓練
高效推理
基於優化的sentence-transformers框架,提供快速的句子嵌入計算

模型能力

多語言句子相似度計算
實體匹配與鏈接
文本聚類分析
語義搜索
記錄去重

使用案例

企業數據管理
公司名稱標準化
將不同來源的公司名稱變體匹配到標準名稱
提高企業數據庫的整潔度和一致性
多語言應用
跨語言文檔檢索
在不同語言的文檔中查找語義相似的內容
支持多語言環境下的知識發現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase