M

Multilingual SimCSE

WENGSYXによって開発
平行言語ペアで訓練された対照学習モデルで、異なる言語の平行文ペアを通じてテキストを同じベクトル空間にマッピング
ダウンロード数 84
リリース時間 : 3/2/2022

モデル概要

mDeBERTaアーキテクチャに基づく多言語文埋め込みモデルで、平行コーパス上で対照学習を使用して訓練され、言語間意味類似度計算をサポート

モデル特徴

言語間アラインメント
平行コーパス訓練により異なる言語の文を統一された意味空間にマッピング
対照学習最適化
SimCSEスタイルの対照損失関数を使用して意味表現を強化
大規模訓練
1億組の平行文ペアを使用して事前訓練

モデル能力

言語間文埋め込み
意味類似度計算
多言語テキストアラインメント

使用事例

言語間検索
多言語ドキュメントマッチング
異なる言語のドキュメントライブラリで意味的に類似したドキュメントを検索
コサイン類似度0.87(例:'Hello,world'と'你好,世界'の類似度)
機械翻訳支援
翻訳品質評価
埋め込み類似度を通じて翻訳結果の品質を評価
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase