🚀 Mistral-7B-Mortgage-Loans-v1
本模型專為解決與抵押貸款和貸款相關的查詢而開發,基於預訓練模型微調而來,能為理解複雜的貸款流程和抵押貸款申請提供關鍵答案。
🚀 快速開始
本模型“Mistral-7B-Mortgage-Loans-v1”是 mistralai/Mistral-7B-Instruct-v0.2 的微調版本,可用於處理與抵押貸款和貸款相關的問題。
✨ 主要特性
- 特定領域優化:專門針對抵押貸款和貸款領域進行微調,能精準回答該領域的各類問題。
- 豐富數據支持:基於包含多種意圖和大量示例的數據集進行訓練,確保能處理廣泛的查詢。
- 架構優化:採用
MistralForCausalLM
架構和 LlamaTokenizer
,在保留基礎模型特性的同時進行優化。
💻 使用示例
基礎用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("bitext-llm/Mistral-7B-Mortgage-Loans-v1")
tokenizer = AutoTokenizer.from_pretrained("bitext-llm/Mistral-7B-Mortgage-Loans-v1")
inputs = tokenizer("<s>[INST] What are the requirements for a home loan? [/INST]", return_tensors="pt")
outputs = model.generate(inputs['input_ids'], max_length=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
📚 詳細文檔
模型架構
該模型採用 MistralForCausalLM
架構和 LlamaTokenizer
,在保留基礎模型基本特性的同時,針對抵押貸款和貸款領域進行了優化,以更好地理解和生成相關回復。
訓練數據
模型在專門為抵押貸款和貸款領域設計的數據集上進行訓練,該數據集包含 39 種意圖,如 apply_for_loan
、check_loan_terms
、refinance_loan
、customer_service
等,每種意圖有近 1000 個示例。此數據集與我們在 Hugging Face 上發佈的 bitext/Bitext-customer-support-llm-chatbot-training-dataset 採用相同的結構化方法,但專注於抵押貸款和貸款領域。
訓練過程
超參數
參數 |
值 |
優化器 |
AdamW |
學習率 |
0.0002(使用餘弦學習率調度器) |
訓練輪數 |
4 |
批次大小 |
10 |
梯度累積步數 |
8 |
最大序列長度 |
8192 個標記 |
環境
環境 |
版本 |
Transformers 版本 |
4.40.0.dev0 |
框架 |
PyTorch 2.2.1+cu121 |
分詞器 |
Tokenizers 0.15.0 |
預期用途
- 推薦應用場景:該模型對金融機構、抵押貸款經紀人及貸款提供商特別有用,可集成到客戶支持系統中,幫助用戶瞭解貸款選項、抵押貸款細節和還款計劃。
- 不適用場景:該模型並非為非金融查詢而設計,不應用於提供法律、醫療或其他超出其金融專業領域的建議。
侷限性和偏差
- 領域侷限性:模型在特定領域數據集上進行微調,在金融建議範圍之外的表現可能不佳。
- 潛在偏差:用戶應注意訓練數據中可能存在的偏差,因為模型的回覆可能會不經意地反映這些偏差。由於模型使用的數據集用於回答一般的抵押貸款和貸款問題,特定用例可能存在潛在偏差。
倫理考量
使用該模型時應考慮自動化金融建議的倫理影響,確保模型的建議能補充人類專業知識,並遵守相關金融法規。
致謝
該模型由 Bitext 開發,並在 Bitext 提供的基礎設施上進行訓練。
📄 許可證
本模型“Mistral-7B-Mortgage-Loans-v1”由 Bitext Innovations International, Inc. 根據 Apache License 2.0 許可。此開源許可證允許免費使用、修改和分發該模型,但要求對 Bitext 給予適當的認可。
Apache 2.0 許可證要點
- 許可範圍:用戶可自由使用、修改和分發此軟件。
- 歸屬要求:使用此模型時,必須根據原始版權聲明和許可證向 Bitext Innovations International, Inc. 提供適當的認可。
- 專利授予:許可證包含模型貢獻者授予的專利權。
- 無擔保聲明:模型“按原樣”提供,不提供任何形式的保證。
您可在 Apache License 2.0 查看完整的許可證文本。此許可確保模型在尊重 Bitext 知識產權貢獻的同時能得到廣泛自由的使用。如需獲取更詳細信息或有關使用此許可證的特定法律問題,請參考上述鏈接的官方許可證文檔。