🚀 銷售轉化預測模型
這是一個強化學習模型,利用Azure OpenAI嵌入技術,在客戶對話期間即時預測銷售轉化概率。
🚀 快速開始
在Colab上運行,使用unsloth/gemma - 3 - 4b - it - GGUF模型和BAAI/bge - m3開源嵌入
點擊下面的按鈕在Colab中打開:

直接運行開源模型
!python opensource_inference.py --model_path sales_conversion_model
✨ 主要特性
- 利用Azure OpenAI嵌入技術,在客戶對話中即時預測銷售轉化概率。
- 模型學會識別關鍵對話模式,如技術買家對詳細功能的響應、價格敏感客戶對投資回報率的需求等。
- 在轉化預測中達到96.7%的準確率,相較於僅使用大語言模型的方法,性能提升34.7%。
- 推理速度快,達到85ms,相比GPT - 4的3450ms有顯著優勢。
- 銷售人員使用該模型時,轉化率提高43.2%。
📦 安裝指南
使用Python 3.11進行推理
重要提示:推理時請使用Python 3.11版本,否則會導致層維度錯誤。
conda create -n salespy11 pip python=3.11
conda activate salespy11
pip install azure-openai stable-baselines3 numpy torch huggingface_hub
git lfs install
git clone https://huggingface.co/DeepMostInnovations/sales-conversion-model-reinf-learning
cd sales-conversion-model-reinf-learning
使用Python 3.10運行Azure嵌入訓練模型
重要提示:推理時請使用Python 3.10版本,否則會導致層維度錯誤。
conda create -n salespy10 pip python=3.10
conda activate salespy110
pip install azure-openai stable-baselines3 numpy torch huggingface_hub
python sales_inference.py --model_path sales_model.zip --conversation_json sample_conv_generated.json --azure_api_key "api_key" --azure_endpoint "https://resource_name.openai.azure.com/" --azure_deployment_name "text-embedding-3-large" --azure_api_version "2023-12-01-preview" --embedding_dim 3072
💻 使用示例
輸出示例
--- 對話預測(使用Azure OpenAI嵌入) ---
Turn 1 (客戶): "Hello, I'm looking for information on your new AI-powered CR..." -> 概率: 0.1744
Turn 2 (銷售代表): "You've come to the right place! Our new AI CRM is designed t..." -> 概率: 0.3292
Turn 3 (客戶): "maybe not for us. its a great product, in future may buy..." -> 概率: 0.3350
Turn 4 (銷售代表): "Excellent, those are two key strengths. Our AI analyzes lead..." -> 概率: 0.3908
Turn 5 (客戶): "looks oke, but maybe we can't consider..." -> 概率: 0.3833
生成和清理數據集
python generate_dataset.py --num_conversations 100000 --num_profiles 20 --output_path custom_dataset.csv --num_threads 15 --rate_limit 2000 --batch_size 10
python clean_dataset.py custom_dataset.csv --chunk_size 1000 --skip_encoding_check
訓練模型
git lfs install
git clone https://huggingface.co/datasets/DeepMostInnovations/saas-sales-conversations
cd saas-sales-conversations
python train.py --dataset cleaned_custom_dataset.csv --model_path {sales-conversion-model-reinf-learning path}/sales_model --timesteps 200000 --batch_size 64
📚 詳細文檔
論文信息
模型架構
屬性 |
詳情 |
框架 |
Stable Baselines3 (PPO) |
狀態表示 |
Azure OpenAI嵌入 |
動作空間 |
連續(轉化概率0 - 1) |
特徵提取器 |
自定義線性層 |
訓練數據
- 使用大語言模型生成的合成銷售對話。
- 涵蓋不同客戶類型的100,000 + 個對話場景。
- 嵌入捕獲對話語義信息。
模型性能
模型學會識別關鍵對話模式:
- 技術買家對詳細功能有響應。
- 價格敏感客戶需要投資回報率的理由。
- 早期潛在客戶需要進行需求評估。
根據論文,SalesRLAgent達到:
- 96.7%的轉化率預測準確率。
- 比僅使用大語言模型的方法性能提升34.7%。
- 推理速度為85ms,而GPT - 4為3450ms。
- 銷售人員使用時轉化率提高43.2%。
🔧 技術細節
模型使用Stable Baselines3框架中的PPO算法,結合Azure OpenAI的嵌入技術來表示對話狀態。通過自定義線性層進行特徵提取,動作空間為連續的轉化概率(0 - 1)。在訓練過程中,使用合成銷售對話數據,這些數據涵蓋了不同類型客戶的對話場景,並且嵌入能夠捕獲對話的語義信息。
📄 許可證
本項目採用MIT許可證,你可以根據自己的需求自由使用和修改。
引用
如果你使用了這個模型,請引用以下內容:
@article{nandakishor2025salesrlagent,
title={SalesRLAgent: A Reinforcement Learning Approach for Real-Time Sales Conversion Prediction and Optimization},
author={Nandakishor, M},
journal={arXiv preprint arXiv:2503.23303},
year={2025},
url={https://arxiv.org/abs/2503.23303}
}