Berdou 500k
基於Bertimbau-Base模型在巴西聯邦官方公報50萬條實例上進行MLM(掩碼語言建模)微調的葡萄牙語BERT模型
下載量 16
發布時間 : 3/2/2022
模型概述
專門針對巴西法律和政府公文優化的預訓練語言模型,適用於處理葡萄牙語官方文檔的語義理解任務
模型特點
法律領域優化
在巴西聯邦官方公報數據上微調,對法律術語和政府公文有更好的理解能力
高效微調
基於50萬條高質量官方實例進行MLM任務訓練
原生葡萄牙語支持
專門針對巴西葡萄牙語變體預訓練,包含本地化詞彙
模型能力
法律文本理解
公文語義分析
政府文檔分類
法律實體識別
文本嵌入生成
使用案例
政府文檔處理
官方公報自動分類
對巴西聯邦官方公報進行主題分類
準確率提升15%相比通用葡萄牙語模型
法律條文關聯分析
識別不同法律條文之間的語義關聯
法律科技
法律文書自動摘要
生成政府公告和法律文件的簡明摘要
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98