L

Lt Wikidata Comp Multi

dell-research-harvardによって開発
sentence-transformers/paraphrase-multilingual-mpnet-base-v2をファインチューニングした多言語文類似度モデルで、12言語の意味マッチングタスクをサポート
ダウンロード数 415
リリース時間 : 8/29/2023

モデル概要

このモデルはレコードリンク(エンティティマッチング)タスク向けに設計されており、クラスタリング、重複排除、関連付けなどのシナリオに使用可能。ドイツ語、英語、中国語など12言語の文類似度計算をサポート

モデル特徴

多言語サポート
ヨーロッパとアジアの主要言語を含む12言語の文類似度計算をサポート
エンティティマッチング最適化
会社の別名マッチングなどのエンティティリンクタスク向けに特別に最適化されたトレーニング
効率的な推論
最適化されたsentence-transformersフレームワークに基づき、高速な文埋め込み計算を提供

モデル能力

多言語文類似度計算
エンティティマッチングとリンク
テキストクラスタリング分析
意味検索
レコード重複排除

使用事例

企業データ管理
会社名標準化
異なるソースの会社名バリアントを標準名にマッチング
企業データベースの整頓度と一貫性を向上
多言語アプリケーション
クロスランゲージドキュメント検索
異なる言語のドキュメント間で意味的に類似したコンテンツを検索
多言語環境での知識発見をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase