M

Modernbert Embed Base Legal Matryoshka 2

manishh16によって開発
ModernBERTアーキテクチャを基に最適化された法律分野の埋め込みモデルで、多次元特徴抽出と文類似度計算をサポート
ダウンロード数 14
リリース時間 : 3/28/2025

モデル概要

このモデルはModernBERTアーキテクチャを基に最適化された法律文書埋め込みモデルで、法律文書の文類似度計算と特徴抽出タスクに特化しています。MatryoshkaLossトレーニング手法を採用し、異なる次元の埋め込み表現をサポートします。

モデル特徴

多次元埋め込みサポート
768/512/256/128/64など多様な埋め込み次元をサポートし、アプリケーションシナリオに応じて柔軟に選択可能
法律分野最適化
法律文書に特化して最適化されており、法律用語や文書構造をより良く理解可能
マトリョーシカトレーニング手法
MatryoshkaLossトレーニング戦略を採用し、異なる次元でも良好な性能を維持
効率的な検索能力
情報検索タスクで優れた性能を発揮し、特に法律文書検索シナリオで効果的

モデル能力

法律文書特徴抽出
文類似度計算
情報検索
多次元埋め込み表現

使用事例

法律文書処理
法律事例検索
クエリ文に基づいて関連する法律事例を検索
768次元設定で0.59の精度@1を達成
契約条項マッチング
契約内の類似条項をマッチング
512次元設定で0.69の精度@5を達成
法律研究支援
判例法分析
判例法における類似判決を分析
256次元設定で0.72の再現率@10を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase