B

Bert Large Portuguese Cased Legal Tsdae Gpl Nli Sts V1

由stjiris開發
基於BERTimbau大模型的法律領域專用葡萄牙語句子轉換器,支持語義相似度計算
下載量 17
發布時間 : 1/5/2023

模型概述

這是一個針對葡萄牙語法律文本優化的句子轉換器模型,能將句子映射到1024維向量空間,適用於法律領域的語義搜索、聚類和文本相似度計算任務。

模型特點

法律領域優化
專門針對葡萄牙語法律文本進行訓練和優化,包含約3萬份法律文書數據
先進訓練技術
採用TSDAE(Transformer-based Sequential Denoising Auto-Encoder)技術訓練,結合生成式偽標籤(GPL)增強
多階段訓練
經過自然語言推理(NLI)和語義文本相似度(STS)多階段微調
高性能
在多個葡萄牙語STS數據集上表現出色,皮爾遜相關係數達0.77-0.84

模型能力

句子嵌入生成
語義相似度計算
法律文本分析
葡萄牙語處理
文本聚類

使用案例

法律文本處理
法律文書語義搜索
在法律文檔庫中實現基於語義的搜索功能
在最高法院語義搜索系統中表現優異
判例相似度分析
自動計算不同判例文書之間的語義相似度
通用文本處理
文本聚類
將相似內容的葡萄牙語文檔自動分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase