🚀 销售转化预测模型
这是一个强化学习模型,利用Azure OpenAI嵌入技术,在客户对话期间实时预测销售转化概率。
🚀 快速开始
在Colab上运行,使用unsloth/gemma - 3 - 4b - it - GGUF模型和BAAI/bge - m3开源嵌入
点击下面的按钮在Colab中打开:

直接运行开源模型
!python opensource_inference.py --model_path sales_conversion_model
✨ 主要特性
- 利用Azure OpenAI嵌入技术,在客户对话中实时预测销售转化概率。
- 模型学会识别关键对话模式,如技术买家对详细功能的响应、价格敏感客户对投资回报率的需求等。
- 在转化预测中达到96.7%的准确率,相较于仅使用大语言模型的方法,性能提升34.7%。
- 推理速度快,达到85ms,相比GPT - 4的3450ms有显著优势。
- 销售人员使用该模型时,转化率提高43.2%。
📦 安装指南
使用Python 3.11进行推理
重要提示:推理时请使用Python 3.11版本,否则会导致层维度错误。
conda create -n salespy11 pip python=3.11
conda activate salespy11
pip install azure-openai stable-baselines3 numpy torch huggingface_hub
git lfs install
git clone https://huggingface.co/DeepMostInnovations/sales-conversion-model-reinf-learning
cd sales-conversion-model-reinf-learning
使用Python 3.10运行Azure嵌入训练模型
重要提示:推理时请使用Python 3.10版本,否则会导致层维度错误。
conda create -n salespy10 pip python=3.10
conda activate salespy110
pip install azure-openai stable-baselines3 numpy torch huggingface_hub
python sales_inference.py --model_path sales_model.zip --conversation_json sample_conv_generated.json --azure_api_key "api_key" --azure_endpoint "https://resource_name.openai.azure.com/" --azure_deployment_name "text-embedding-3-large" --azure_api_version "2023-12-01-preview" --embedding_dim 3072
💻 使用示例
输出示例
--- 对话预测(使用Azure OpenAI嵌入) ---
Turn 1 (客户): "Hello, I'm looking for information on your new AI-powered CR..." -> 概率: 0.1744
Turn 2 (销售代表): "You've come to the right place! Our new AI CRM is designed t..." -> 概率: 0.3292
Turn 3 (客户): "maybe not for us. its a great product, in future may buy..." -> 概率: 0.3350
Turn 4 (销售代表): "Excellent, those are two key strengths. Our AI analyzes lead..." -> 概率: 0.3908
Turn 5 (客户): "looks oke, but maybe we can't consider..." -> 概率: 0.3833
生成和清理数据集
python generate_dataset.py --num_conversations 100000 --num_profiles 20 --output_path custom_dataset.csv --num_threads 15 --rate_limit 2000 --batch_size 10
python clean_dataset.py custom_dataset.csv --chunk_size 1000 --skip_encoding_check
训练模型
git lfs install
git clone https://huggingface.co/datasets/DeepMostInnovations/saas-sales-conversations
cd saas-sales-conversations
python train.py --dataset cleaned_custom_dataset.csv --model_path {sales-conversion-model-reinf-learning path}/sales_model --timesteps 200000 --batch_size 64
📚 详细文档
论文信息
模型架构
属性 |
详情 |
框架 |
Stable Baselines3 (PPO) |
状态表示 |
Azure OpenAI嵌入 |
动作空间 |
连续(转化概率0 - 1) |
特征提取器 |
自定义线性层 |
训练数据
- 使用大语言模型生成的合成销售对话。
- 涵盖不同客户类型的100,000 + 个对话场景。
- 嵌入捕获对话语义信息。
模型性能
模型学会识别关键对话模式:
- 技术买家对详细功能有响应。
- 价格敏感客户需要投资回报率的理由。
- 早期潜在客户需要进行需求评估。
根据论文,SalesRLAgent达到:
- 96.7%的转化率预测准确率。
- 比仅使用大语言模型的方法性能提升34.7%。
- 推理速度为85ms,而GPT - 4为3450ms。
- 销售人员使用时转化率提高43.2%。
🔧 技术细节
模型使用Stable Baselines3框架中的PPO算法,结合Azure OpenAI的嵌入技术来表示对话状态。通过自定义线性层进行特征提取,动作空间为连续的转化概率(0 - 1)。在训练过程中,使用合成销售对话数据,这些数据涵盖了不同类型客户的对话场景,并且嵌入能够捕获对话的语义信息。
📄 许可证
本项目采用MIT许可证,你可以根据自己的需求自由使用和修改。
引用
如果你使用了这个模型,请引用以下内容:
@article{nandakishor2025salesrlagent,
title={SalesRLAgent: A Reinforcement Learning Approach for Real-Time Sales Conversion Prediction and Optimization},
author={Nandakishor, M},
journal={arXiv preprint arXiv:2503.23303},
year={2025},
url={https://arxiv.org/abs/2503.23303}
}