R

Robertalexpt Base

由eduagarcia開發
RoBERTaLexPT-base 是一個葡萄牙語掩碼語言模型,專門針對法律領域優化,通過LegalPT和CrawlPT語料庫預訓練。
下載量 366
發布時間 : 1/9/2024

模型概述

該模型是基於RoBERTa架構的葡萄牙語語言模型,專注於法律文本處理,支持葡萄牙語(包括巴西和歐洲變體)。

模型特點

法律領域優化
專門針對葡萄牙語法律文本進行預訓練和優化
多樣化訓練數據
結合法律領域(LegalPT)和通用領域(CrawlPT)數據進行訓練
高性能
在葡萄牙語法律NLP任務中表現優於同類模型
數據去重
訓練前使用MinHash算法對數據進行去重處理

模型能力

葡萄牙語文本理解
法律文本分析
命名實體識別
標記分類

使用案例

法律文本處理
法律文件分析
分析法律文件中的關鍵信息
在PortuLex基準測試中達到85.41%的平均F1分數
法律實體識別
識別法律文本中的特定實體
在LeNER數據集上達到90.73%的F1分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase