【干货】Logistic回归Python实战,评估销售系统的盈利能力

【导读】一个企业的盈利与其销售市场部门密不可分,传统的销售手段是销售人员逐个联系现有或潜在的顾客,这种方式不仅耗时耗力,而且不可避免地会有疏漏,不能够精准地联系到购买潜力较大的顾客。在本文中,Sai Vishnu Kanisetty将机器学习中的Logistic Regression(逻辑回归)运用到销售系统中,用Python实现,目的是寻找系统中具有高转化率的客户,从而提高工作效率,提升企业利润。专知内容组编辑整理。




Logistic Regression in Python to evaluate profitability of Sales-Marketing System


企业的销售和营销部门负责“找到客户,销售和赢利”。销售人员通过多种沟通方式联系现有客户和潜在客户,由于时间和成本限制,不能联系到所有的客户。在这篇文章中,机器学习中的逻辑回归(Logistic Regression)被用来识别具有较高转化率的目标人群,针对确定群体的盈利能力进行评估。

要了解更多内容,请参考我的GitHub。


GitHub:

https://github.com/saivishnuk/Data-Science/tree/master/Logistic-Regression-to-evaluate-profitability-of-Sales-Marketing-System


文章大纲



 

1)总体了解销售系统,并说明本文中使用的示例;

2)了解逻辑回归技术,以及在这种情况下它如何发挥作用;

3)方法,代码和盈利能力的评估结果。


总体了解销售系统,并说明本文中使用的示例



大多数销售系统都是通过销售代理访问或手机联系客户。生成销售线索和将销售线索转化为客户以及接触客户都要消耗成本,是一项时间和成本密集型任务。


例如,一家公司推出了一款新产品,并希望与可能对该产品感兴趣的现有客户进行接触。 公司现有客户的数量为41,188,公司估计接触客户的平均成本为10美元,如果客户购买产品,那么平均收入为50美元。从数字来看,成本与收入比是1:5,这样做会产生很大的利润。意识到以前的市场营销活动(〜11.5%)中同类产品的转化率,管理者明白,这种瞄准每一个客户的做法会造成很大的损失。 因此,经理决定“首先确定目标受众,然后再做预算。 他希望他团队的数据科学家回答3个问题:


  • 实现最高投资回报的成本是多少?

  • 实现最高利润的成本是多少?

  • 利润-投资平衡点涉及的成本是多少?

 

了解逻辑回归技术,以及在这种情况下它如何发挥作用



二项逻辑回归(binomial logistic regression)预测了二分类中类别的概率,该变量基于一个或多个独立的变量,可以是连续的也可以是离散的。 在销售系统中,因变量是先前营销活动的结果,自变量是先前的活动指标,如“过去已达到客户的次数”,“自上次购买以来的天数”,以及客户的统计特征。在本文中,我们假设数据已经按照7/3的比例划分为训练集和测试集,并且我们只关注衡量盈利率的方法。


方法,代码和盈利能力的评估结果



1.在训练集和测试集中,结果变量为“1”(购买产品标记为1)的客户的百分比为11.2%。

2.通过训练集中的所有客户来计算“每个客户的平均利润”。



这表明,通过向所有客户提供约11.2%的转换率将导致$ 1,25,710的损失。 所以,可以把目标转向具有更高转换率的顾客。

3. 对训练集进行Logistic回归,并使用事件发生的预测概率、以0.01的间隔来计算每个概率值的成本,收入,利润和投资回报(ROI)。

 

上述函数以“实际结果”,“事件发生的预测概率”,“每个人的成本”,“每个人的收入”,“检查的概率范围”作为输入。 下面的代码调用上述函数,将训练数据作为输入,并估计每个人的成本和收入,来进行决策。




如果客户购买产品或不会购买产品,则“事件发生的可能性”被认为是隔离的。 我们可以观察到,随着“事件发生概率”的增加,“目标顾客百分比”减少。有趣的是,事件发生概率减少了,投资回报率却增加了,这意味着尽管我们减少了顾客数量,但是与增加顾客数量相比,我们得到了很好的结果,这也可以在下面的图表中看到

 

关于事件发生的不同预测概率的收入,成本和专业图表:


 

该图显示,随着“事件发生概率”的增加,成本,收入等指标不断下降,ROI也在增加。 根据“预算限制”,“高投资回报率”等需要,可以选择一个特定的概率作为截止点。

 

不同成本的投资收益和利润图


 

从前面的结果可以看出,这张图也显示了“利润和ROI随成本增加而降低”。这张图可以用来回答管理者提出的三个问题:


1) 实现最高投资回报的成本是多少? 

成本较少会带来较高的投资回报率,但是与较高的成本相比,相关的利润则会较少

2) 实现最高利润的成本是多少? 

成本较高会得到很高的收益,但这样的高成本可能带来更低的投资回报率

3) Profit-ROI平衡点涉及的成本是多少? 

支出11,300美元,可以得到25,300美元的收入,而这笔支出的投资回报率为224,截止概率为0.42



我们还需要确保将截断概率设置为0.42才不会导致过拟合或欠拟合,并且测试数据的结果与训练数据差不多。


 

在上面的代码中,model_eval是用户定义的函数,结果表明训练和测试结果的模型评估指标几乎相同。 因此,0.42可以被视为截止概率,概率在0.42以上的所有客户都可以被视为目标人群。


参考文献:

https://towardsdatascience.com/logistic-regression-in-python-to-evaluate-profitability-of-sales-marketing-system-fe2261964fa4

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

同时欢迎各位用户进行专知投稿,详情请点击

诚邀】专知诚挚邀请各位专业者加入AI创作者计划了解使用专知!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员