M

Modernbert Embed Base Legal MRL

AdamLucekによって開発
ModernBERTをファインチューニングした法律分野の文埋め込みモデルで、多層次元出力をサポートし、法律テキストの類似度計算や情報検索タスクに適しています。
ダウンロード数 40
リリース時間 : 1/20/2025

モデル概要

これは法律分野に最適化された文埋め込みモデルで、テキストを768次元ベクトルに変換でき、多層次元出力(768/512/256/128/64次元)をサポートします。特に法律文書の意味的類似度計算、情報検索、クラスタリング分析に適しています。

モデル特徴

多層次元出力
768/512/256/128/64次元の多層埋め込み出力をサポートし、アプリケーションシナリオに応じて柔軟に次元を選択可能
法律分野最適化
法律分野の合成データでファインチューニングされており、法律テキスト処理において優れた性能を発揮
長文サポート
最大8192トークンのシーケンス長をサポートし、法律文書などの長文処理に適している
効率的な検索能力
情報検索タスク、特に法律文書検索シナリオで優れた性能を発揮

モデル能力

意味的テキスト類似度計算
意味検索
情報検索
テキストクラスタリング
特徴抽出

使用事例

法律文書処理
法律事例検索
クエリ事例に関連する法律文書を迅速に検索
テストセットで0.63の正規化割引累積ゲイン@10を達成
契約条項マッチング
契約書内の類似条項や関連内容を識別
情報検索システム
法律質問応答システム
意味検索に基づく法律質問応答システムを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase