Custom Legalbert
Model Overview
专为法律文本设计的BERT变体,支持法律文档的掩码语言建模和下一句预测任务
Model Features
法律领域专用词汇表
通过32,000个标记的定制词汇表优化法律术语处理
大规模法律语料训练
使用37GB/3,446,187份法律裁决的哈佛案例全集进行预训练
领域适配预处理
分词和句子分割专门针对法律文本特点进行优化
Model Capabilities
法律文本理解
法律文档分类
法律多选题推理
判例引用分析
Use Cases
法律研究
判例引用预测
预测法律裁决中可能引用的相关判例
在CaseHOLD数据集上达到SOTA性能
法律条款分析
解析服务条款等法律文档的关键内容
司法辅助
裁决书生成
辅助生成法律裁决文档的特定部分
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98