M

Modernbert Embed Base Legal MRL

由AdamLucek開發
基於ModernBERT微調的法律領域句子嵌入模型,支持多層次維度輸出,適用於法律文本相似度計算和信息檢索任務。
下載量 40
發布時間 : 1/20/2025

模型概述

這是一個針對法律領域優化的句子嵌入模型,能夠將文本轉換為768維向量,支持多層次維度輸出(768/512/256/128/64維),特別適合法律文檔的語義相似度計算、信息檢索和聚類分析。

模型特點

多層次維度輸出
支持768/512/256/128/64維多層次嵌入輸出,可根據應用場景靈活選擇維度
法律領域優化
使用法律領域合成數據微調,在處理法律文本時表現優異
長文本支持
最大支持8192標記的序列長度,適合處理法律文檔等長文本
高效檢索能力
在信息檢索任務中表現出色,特別是在法律文檔檢索場景

模型能力

語義文本相似度計算
語義搜索
信息檢索
文本聚類
特徵提取

使用案例

法律文檔處理
法律案例檢索
快速檢索與查詢案例相關的法律文檔
在測試集上達到0.63的歸一化折損累積增益@10
合同條款匹配
識別合同中的相似條款和關聯內容
信息檢索系統
法律問答系統
構建基於語義檢索的法律問答系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase