P

Paraphrase Mpnet Base V2 Fuzzy Matcher

shahrukhx01によって開発
文字レベルのトークン訓練に基づくSiamese BERTアーキテクチャで、埋め込みベースのファジーマッチングを実現
ダウンロード数 7,216
リリース時間 : 3/2/2022

モデル概要

このモデルは文字レベルのトークン訓練に基づくSiamese BERTアーキテクチャを採用し、スペルミスやバリエーション形式などのファジーマッチングシナリオを効果的に処理できるように設計されています。

モデル特徴

文字レベル処理
単語を文字レベルに分割して処理し、スペルミスやバリエーション形式の認識能力を強化
Siameseアーキテクチャ
Siameseネットワーク構造を採用し、2つの文字列の類似度を効果的に比較可能
埋め込みベースマッチング
文字列の埋め込み表現を生成し、コサイン類似度を使用してファジーマッチングを実施

モデル能力

ファジー文字列マッチング
スペルミス認識
バリエーション形式認識
文字列類似度計算

使用事例

データクリーニング
レコードリンク
データベース内でスペルが異なるが実質的に同じレコードをマッチング
データの一貫性と正確性の向上
検索強化
ファジー検索
検索システムでタイプミスを許容する検索機能を実現
ユーザー体験と検索リコール率の向上
エンティティ解決
エンティティ曖昧性解消
異なる表現方法だが同一エンティティを指すテキストを識別
知識グラフ構築品質の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase