B

Bi Encoder Msmarco Bert Base German

PM-AIによって開発
ドイツ語版MSMARCOデータセットで訓練された意味検索モデル、困難なネガティブサンプルとMargin MSE損失関数で最適化
ダウンロード数 20.53k
リリース時間 : 11/23/2022

モデル概要

このモデルはドイツ語の意味検索と文書検索のために特別に設計されており、クエリに基づいて関連段落を見つけることができます。機械翻訳されたドイツ語MSMARCOデータセットで訓練され、先進的な訓練技術を組み合わせて効率的な検索を実現しています。

モデル特徴

困難なネガティブサンプル訓練
複数システムの検索結果をネガティブサンプルとして使用し、モデルが関連段落を区別する能力を向上
Margin MSE損失関数
クロスエンコーダーで双方向エンコーダーの訓練を指導し、類似度間隔計算を最適化
非対称検索最適化
クエリ-段落の非対称検索シナリオに特化して最適化
クロスドメイン適用性
MSMARCOの多分野データで訓練され、様々な分野の検索ニーズに対応

モデル能力

意味検索
段落検索
クエリ-段落マッチング
クロスドメイン情報検索

使用事例

情報検索
質問応答システム
ユーザーの質問に基づいて最も関連性の高い回答段落を検索
germandpr-beirテストセットでNDCG@10が0.7196を達成
文書検索
大規模な文書ライブラリから関連コンテンツを特定
従来のBM25アルゴリズムより約34%優れている
企業アプリケーション
ナレッジベース検索
企業ナレッジベースで迅速に関連情報を特定
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase