🚀 SaulLM-54B-Instruct模型介绍
SaulLM-54B-Instruct是一款专为法律领域打造的先进语言模型。它由Equall与巴黎萨克雷大学(CentraleSupélec)的MICS合作开发,旨在推动法律工作专用大语言模型的发展。该模型基于美国和欧洲法律数据库的数据进行预训练和微调,拥有540亿参数。
⚠️ 重要提示
本模型仅用于研究目的,请谨慎使用。
✨ 主要特性
- 专为法律领域设计:专注于法律任务,利用美国和欧洲法律数据库的数据进行预训练和微调。
- 多机构合作开发:由Equall和巴黎萨克雷大学(CentraleSupélec)的MICS共同开发。
- 参数规模大:拥有540亿参数,具备强大的语言处理能力。
📚 详细文档
模型详情
模型描述
SaulLM-54B-Instruct 是一款专门为法律领域设计的先进语言模型。它由Equall与巴黎萨克雷大学(CentraleSupélec)的MICS合作开发,旨在推动法律工作专用大语言模型的发展。
- 开发者:Equall和巴黎萨克雷大学(CentraleSupélec)的MICS
- 模型类型:一个拥有540亿参数的模型,针对法律任务进行了预训练和微调,利用了美国和欧洲法律数据库的数据。
- 支持语言:英语
- 许可证:MIT许可证
- 微调基础模型:基于Equall开发的基础模型,依赖于Mixtral模型的持续预训练。
预期用途与局限性
预期用途
SaulLM-54B-Instruct旨在支持进一步的研究,并适用于各种法律用例。
局限性
模型提供的信息仅用于参考,不能被解释为法律建议。此外,由于SaulLM-54B-Instruct主要针对美国和欧洲法律体系进行训练,在其他司法管辖区的法律体系中可能表现不佳。
偏差、风险和伦理考量
偏差和风险
尽管采取了措施来减轻偏差,但SaulLM-54B仍可能表现出训练数据中固有的偏差,或者提供不准确的响应。模型是基于特定时间点的信息进行训练的,无法考虑到所有最新的法律发展。用户在使用模型输出时应谨慎,并进行批判性评估,特别是在敏感的法律案件中。基于信息做出决策的责任在于用户,而不是模型或其开发者。建议用户在需要法律建议时寻求合格法律专业人员的帮助。
伦理考量
用户必须负责任地使用SaulLM-54B,确保模型不会以违反法律或侵犯他人权利的方式被滥用。特别是,模型不得用于生成有害内容、传播错误信息或侵犯隐私或知识产权。
技术细节
训练数据
SaulLM-54B在一个丰富的数据集上进行训练,该数据集包括欧洲和美国的法律文本、法院裁决和立法文件。
引用信息
如需在您的工作中引用SaulLM-54B,请引用此模型卡片。
@misc{colombo2024saullm54bsaullm141bscaling,
title={SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain},
author={Pierre Colombo and Telmo Pires and Malik Boudiaf and Rui Melo and Dominic Culver and Sofia Morgado and Etienne Malaboeuf and Gabriel Hautreux and Johanne Charpentier and Michael Desa},
year={2024},
eprint={2407.19584},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2407.19584},
}
信息表格
属性 |
详情 |
模型类型 |
一个拥有540亿参数的模型,针对法律任务进行了预训练和微调,利用了美国和欧洲法律数据库的数据。 |
训练数据 |
欧洲和美国的法律文本、法院裁决和立法文件。 |
开发者 |
Equall和巴黎萨克雷大学(CentraleSupélec)的MICS |
支持语言 |
英语 |
许可证 |
MIT许可证 |
微调基础模型 |
基于Equall开发的基础模型,依赖于Mixtral模型的持续预训练。 |