M

Modernbert Embed Base Legal Matryoshka 2

由manishh16開發
基於ModernBERT架構優化的法律領域嵌入模型,支持多維度特徵提取和句子相似度計算
下載量 14
發布時間 : 3/28/2025

模型概述

該模型是基於ModernBERT架構優化的法律文本嵌入模型,專門用於處理法律文檔的句子相似度計算和特徵提取任務。採用MatryoshkaLoss訓練方法,支持不同維度的嵌入表示。

模型特點

多維度嵌入支持
支持768/512/256/128/64等多種嵌入維度,可根據應用場景靈活選擇
法律領域優化
專門針對法律文本進行優化,能更好理解法律術語和文檔結構
Matryoshka訓練方法
採用MatryoshkaLoss訓練策略,使模型在不同維度都能保持良好性能
高效檢索能力
在信息檢索任務中表現出色,特別是在法律文檔檢索場景

模型能力

法律文本特徵提取
句子相似度計算
信息檢索
多維度嵌入表示

使用案例

法律文檔處理
法律案例檢索
根據查詢語句檢索相關法律案例
在768維設置下達到0.59的準確率@1
合同條款匹配
匹配合同中的相似條款
在512維設置下達到0.69的準確率@5
法律研究輔助
判例法分析
分析判例法中的相似判決
在256維設置下達到0.72的召回率@10
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase