🚀 Mistral-7B-Mortgage-Loans-v1
本模型专为解决与抵押贷款和贷款相关的查询而开发,基于预训练模型微调而来,能为理解复杂的贷款流程和抵押贷款申请提供关键答案。
🚀 快速开始
本模型“Mistral-7B-Mortgage-Loans-v1”是 mistralai/Mistral-7B-Instruct-v0.2 的微调版本,可用于处理与抵押贷款和贷款相关的问题。
✨ 主要特性
- 特定领域优化:专门针对抵押贷款和贷款领域进行微调,能精准回答该领域的各类问题。
- 丰富数据支持:基于包含多种意图和大量示例的数据集进行训练,确保能处理广泛的查询。
- 架构优化:采用
MistralForCausalLM
架构和 LlamaTokenizer
,在保留基础模型特性的同时进行优化。
💻 使用示例
基础用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("bitext-llm/Mistral-7B-Mortgage-Loans-v1")
tokenizer = AutoTokenizer.from_pretrained("bitext-llm/Mistral-7B-Mortgage-Loans-v1")
inputs = tokenizer("<s>[INST] What are the requirements for a home loan? [/INST]", return_tensors="pt")
outputs = model.generate(inputs['input_ids'], max_length=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
📚 详细文档
模型架构
该模型采用 MistralForCausalLM
架构和 LlamaTokenizer
,在保留基础模型基本特性的同时,针对抵押贷款和贷款领域进行了优化,以更好地理解和生成相关回复。
训练数据
模型在专门为抵押贷款和贷款领域设计的数据集上进行训练,该数据集包含 39 种意图,如 apply_for_loan
、check_loan_terms
、refinance_loan
、customer_service
等,每种意图有近 1000 个示例。此数据集与我们在 Hugging Face 上发布的 bitext/Bitext-customer-support-llm-chatbot-training-dataset 采用相同的结构化方法,但专注于抵押贷款和贷款领域。
训练过程
超参数
参数 |
值 |
优化器 |
AdamW |
学习率 |
0.0002(使用余弦学习率调度器) |
训练轮数 |
4 |
批次大小 |
10 |
梯度累积步数 |
8 |
最大序列长度 |
8192 个标记 |
环境
环境 |
版本 |
Transformers 版本 |
4.40.0.dev0 |
框架 |
PyTorch 2.2.1+cu121 |
分词器 |
Tokenizers 0.15.0 |
预期用途
- 推荐应用场景:该模型对金融机构、抵押贷款经纪人及贷款提供商特别有用,可集成到客户支持系统中,帮助用户了解贷款选项、抵押贷款细节和还款计划。
- 不适用场景:该模型并非为非金融查询而设计,不应用于提供法律、医疗或其他超出其金融专业领域的建议。
局限性和偏差
- 领域局限性:模型在特定领域数据集上进行微调,在金融建议范围之外的表现可能不佳。
- 潜在偏差:用户应注意训练数据中可能存在的偏差,因为模型的回复可能会不经意地反映这些偏差。由于模型使用的数据集用于回答一般的抵押贷款和贷款问题,特定用例可能存在潜在偏差。
伦理考量
使用该模型时应考虑自动化金融建议的伦理影响,确保模型的建议能补充人类专业知识,并遵守相关金融法规。
致谢
该模型由 Bitext 开发,并在 Bitext 提供的基础设施上进行训练。
📄 许可证
本模型“Mistral-7B-Mortgage-Loans-v1”由 Bitext Innovations International, Inc. 根据 Apache License 2.0 许可。此开源许可证允许免费使用、修改和分发该模型,但要求对 Bitext 给予适当的认可。
Apache 2.0 许可证要点
- 许可范围:用户可自由使用、修改和分发此软件。
- 归属要求:使用此模型时,必须根据原始版权声明和许可证向 Bitext Innovations International, Inc. 提供适当的认可。
- 专利授予:许可证包含模型贡献者授予的专利权。
- 无担保声明:模型“按原样”提供,不提供任何形式的保证。
您可在 Apache License 2.0 查看完整的许可证文本。此许可确保模型在尊重 Bitext 知识产权贡献的同时能得到广泛自由的使用。如需获取更详细信息或有关使用此许可证的特定法律问题,请参考上述链接的官方许可证文档。