毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 即时新闻

    CDA数据分析师编译:如何评估机器学习模型的商业价值

    2021年09月22日 11:59:04   来源:中文科技资讯

      概述

      对于任何评估来说,CDA数据分析师认为最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程。随着工具、算法的进步,以及随着 MLOps 的出现,事情变得容易了很多,而且未来也会继续发展——技术会优化自己。

      业务方面呢?说服客户相信使用先进工具和技术构建的复杂模型的预测能力有多容易?客户是否愿意为项目提供资金并信任我们模型的建议?好吧,不妨试着解释模型的 ROC 曲线,试着用特异性和敏感性指标来说服客户——你会看到的只是眼球在滚动。

      但是,如果我们能够在没有复杂指标和技术术语的情况下回答业务问题呢?那么,我们就可能有机会从业务部门那里获得支持。在本文中,我们将看到一个用例,在该用例中,我们仍将构建我们的模型,但以不同的方式对其进行解释——业务方式。

      使用 ML 模型提取商业价值的方法

      在今天CDA数据分析师编译的这篇博客中,我们将探索十分位数的使用,了解各种评估图,如累积增益图和提升图等,以评估 ML 模型的商业价值。该方法将帮助我们解释 ML 模型的预测能力,并使解释模型结果变得很简单。这些图表和指标将使企业能够更有信心地做出明智的决策。

      我们将在本文中探索以下主题。

      数据探索

      数据处理

      建立模型

      生成十分位数和报告

      模型对比

      业务场景

      结论

      入门

      我们将使用来自 UCI 机器学习存储库的公开可用的银行数据 集, zip 文件中有四个数据集,但我们感兴趣的是*bank-additional-full.csv。*所有的属性信息都可以在上面的 URL 中找到。数据来自直接营销电话联系客户,以评估客户是否有兴趣订阅银行定期存款。如果订阅,则为 Yes,否则为 No。本文讨论的是如何评估 ML 模型的商业价值。

      数据加载和处理:

      让我们加载数据并查看一下以便更好的理解数据。

      我们可以进行完整的EDA/特征工程/选择重要变量然后构建模型,但为了简单起见,我们将选择很少的变量进行模型构建。

      此外,还需要更进一步地探索数据,将目标变量转换为分类变量并对其进行编码。

      输出:

      模型构建以提取商业价值

      逻辑回归

      Step1:定义自变量和目标变量

      Step2:将数据集拆分为训练集和测试集,其中测试大小为整个数据集的 20%

      Step3:建立逻辑回归模型

      至此,我们已经建立了模型,并在测试数据上对其进行了评分(预测),这为我们提供了每个观察结果的预测概率。

      生成十分位数

      简单地说,十分位数把数据进行分箱。所以,我们将所有预测的概率分成十组,并对它们进行排名,这意味着最高的预测概率将在十分之一,最低的设置将在十分之一。我们将使用pandas的 cut() 函数拆分数据。

      下面的代码行创建一个名为Decile_rank_glm的新列, 它保存每个预测记录的排名。

      注: 0.99 的概率为 1,0.93 为 2,0.85 为 4,0.59 为 9。我们将在后面的部分中看到此结果的可视化。

      模型评估以提取商业价值

      我们构建的任何模型都必须与基线模型进行比较,以评估模型的性能。请跟CDA数据分析师一起在下面进一步探讨这一点。

      随机模型:基线模型将是一个随机模型,这意味着它与抛硬币一样好,这意味着有 50% 的概率客户的电话是正确的或者客户购买我们的产品。我们的逻辑回归模型的性能显然应该比这更好。

      向导模型:这是另一个极端模型,它的预测是完美的,这意味着它几乎以 100% 的准确度进行预测。此模型不应用于生产或任何业务决策,因为很可能会过度拟合。

      逻辑回归:我们的模型应该介于这两个极端模型之间,这使我们有足够的信心做出业务决策。

      我们将在累积增益图中可视化上述模型。展现逻辑回归的性能。

      到目前为止看起来不错,图在预期线上,逻辑回归模型介于我们讨论的两个极端模型之间。

      累积增益图的见解:

      如果我们只能选择前 20%(十分位数 1 和十分位数 2),那么我们就可以覆盖**近 80%**的目标类别。

      由于这是一个累积图,我们看到**曲线在十分位数 5 之后变平,**这意味着十分位数 6 到 10 要么有最少的记录,要么没有。

      向导模型在十分位数 2 的位置达到了100% 标记——我们已经知道这是一个理想模型,仅供参考。如果我们的模型开始接近或者类似于这两个极端模型中的任何一个,那么需要检查我们的模型。

      到目前为止,CDA数据分析师已经与你一起讨论了模型、十分位数及其性能比较。让我们在十分位数级别上进一步探讨这一点,以更清楚地了解发生了什么以及我们如何更好地解释这个过程。我们将在视觉效果的帮助下进行分析,这使它变得更加容易。kds 包有一个非常好的功能,可以在一行代码中生成所有指标报告。

      让我们了解这些情节中的每一个。需要注意的是,所有图的 x 轴都是十分位数。

      提升图(Lift Plot):这个图向我们展示了逻辑回归模型与随机模型相比到底有多好。例如:十分位数 2 给了我们几乎 4 倍的提升,这意味着我们可以比随机模型方法做得好 4 倍。当我们进入更高的十分位数时,升力下降并最终满足随机模型线,这是因为所有更高的概率分数值都在我们已经在累积增益图中看到的最高十分位数(1 到 3)中。因此,底部十分位数的概率较低且几乎与随机模型相同。

      十分位数提升图(Decile-wise Lift Plot):该图向我们展示了每个十分位数中目标类观察的百分比,我们观察到十分位数 1 具有最大值,随着x轴数值的延伸,十分位数百分比下降,在某个点之后它甚至低于随机模型线。这是因为随机模型具有随机设置的均匀分布的观测值,而我们的模型在较高的十分位数中预测的观测值较少。

      累积增益图(Cumulative Gain Plot):在以前的部分中讨论过这个问题,还研究了对图的解释。

      KS 统计图(KS Statistic Plot):KS 图评估不同的分布,即事件和非事件,KS 值是分布之间差异最大的点。简而言之,它有助于我们理解 ML 模型区分两个事件的能力。KS 分数大于 40,如果它恰好在前 3 个十分位数中,那么它被认为是好的。在我们的例子中,我们从图中得到了 68.932 和十分位数 3 的分数。

      让我们用随机森林再构建一个模型,看看结果如何。

      观察:

      随机森林模型略好于逻辑回归模型。

      十分位数 2 的提升略高,KS 统计数据为 72.18,而logistic统计数据为 68.93

      业务场景

      建议控制:在某些情况下,客户有业务需求,即应始终生成最少 X 条建议。在这种情况下,我们可以通过考虑前 3 个十分位数而不是 2 个十分位数来获得更大的建议,并且还可以对其他记录进行精细控制。

      衡量市场反应:推荐后分析和市场反应很容易衡量。例如,从前一点,我们可以单独跟踪来自十分位数 3 的所有额外推荐的表现。来自十分位数 3 的额外推送是否产生了任何影响(正面或负面)?

      优化营销支出:通过关注前 20-30% 的人群,企业可以节省时间、资源和金钱。以避免这些时间、资源和金钱会花费在无响应者或定位错误客户上。

      结语

      CDA数据分析师认为技术有其一席之地,企业也有发言权。归根结底,这一切都与技术带来的商业价值有关。当这些收益用商业术语来解释时,它总是会更有效。它不仅有助于从业务中获得信心,而且还开辟了新的探索机会。

      请注意,我们构建了两个分类模型,但没有研究我们通常为此类模型所做的 ROC 曲线、混淆矩阵、精度、召回率和其他标准指标。强烈建议跟踪和测量这些指标以评估模型的性能,然后遵循此文中的十分位数方法。根据目标受众和目标,使用最适合目标的方法。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。