如何评估一个数据科学项目(在不了解数据科学的情况下)

数据驱动的思考由媒体社群成员撰写,包含有关媒体数位革命的新观点。

今天的专栏作者是Ellen Houston文明的分析

很有可能,在过去几个月的COVID-19危机中,您的分析团队一直在努力工作,试图了解消费者行为发生了什么。这是你恢复策略的重要部分,但并不容易。大流行对人们的观点、恐惧和行为产生了重大影响。趋势在变化,你曾经知道的预测数据已经跨入了未知的世界。如果你不是一个受过培训的数字专家,你如何评估分析团队的项目的方法和结果,并决定你是否对这些发现有足够的信心来采取行动?

作为一个稳步融入分析领域的职业营销人员,我经常遇到这样的情况。这可能有点吓人,但如果你问了正确的问题,理解了一些简单的概念,你就会更加自信,更有能力与分析团队合作。

也许更重要的是,当你需要的时候,你可以叫胡扯。

让我们用一些公司现在面临的典型问题来说明如何在不返回攻读硕士学位的情况下更好地理解项目工作的来由。这通常涉及几个步骤:将数据放在一个地方,构建和细化模型,然后共享结果。


数据出了什么问题?

任何数据科学家都会告诉你:没有数据集是完美的。这并不是说不完美的数据是坏的或无用的。你只需要明白如何它是不完美的,这个缺陷会对结论产生什么样的影响。例如,在过去,您可能只使用来自您的忠诚计划的数据。这种行为将不同于更广泛的消费者群体或整体市场(可能更积极)。

今天,一个常见的问题是:疫情爆发前的数据在多大程度上有助于我理解未来的表现?答案是,在这方面仍有很多不确定性。然而,为了限制这种不确定性,你可以做一些事情。

首先,愿意承担一些经过计算的风险。在市场上测试你的一群客户的报价或信息,以了解他们之前类似报价的表现如何,从而了解其影响的大小。

第二,开始了解你的客户群是如何变化的。这可以通过调查或使用公开数据分析关键地理区域来实现。我们的目标是了解疫情是如何影响你们的客户,而不仅仅是所有美国消费者。

经济困难是高于还是低于全国平均水平?你是否集中在受疫情影响较大或较小的地区?这将更深入地了解您的客户对您的组织的需求。

你在做什么模特,你是怎么做的?

只使用“人工智能”、“机器学习”或“专有算法”等术语的对话应该会让人惊讶。使用的算法有很多细微差别和优缺点,但了解一些基本知识会大有帮助。如果一个团队不愿意或不能解释使用的方法?这也是一个危险信号。

首先,您需要了解要预测的准确项。例如,如果有人说销售额是因变量,这是指以单位计算的销售额,还是以美元计算的销售额,还是用是或否来表示的二元购买?所有这些都极大地影响了您如何解释模型的结果,并且您对所预测的内容了解得越多,您就会越了解如何应用建模的结果。

其次,您希望了解使用的是哪种类型的模型。同样,你不需要知道关于随机森林和逻辑回归的一切,但你的团队应该能够清楚地解释他们使用的模型和原因。询问模型在准确性和可解释性方面的优缺点,让他们用简单的英语向你介绍一些重要的特性和他们用来改进模型的过程。躲在行话和高度专业的术语后面,并不能帮助房间里的任何人朝着最好的结果前进。

最后,进行公开讨论。了解团队觉得什么进展顺利,或者他们希望拥有什么其他数据源。问问他们看到了什么限制。就像数据一样,没有一个模型是完美的。一个开放和富有成效的讨论使您能够完全理解当前的限制,因此您可以根据结果做出最明智的决定。

结果和建议是什么?

好,你理解这些数据。您已经浏览了模型,现在您需要了解如何对结果进行操作。

确保你理解了哪些部分的工作导致了这些建议,以及如果你实施了这些建议,你将如何衡量这些建议。分析是一个持续进行的过程,你需要不断迭代,有时它是正确的,有时你需要学习。

做一个好奇的读者。确保您理解了各种可用的图表和图表。所有的轴都是从0开始的吗?你能解释一下幻灯片上的结论吗?

分析可以挑战传统智慧,帮助你更精确——但不要忽视你的直觉。如果结果与过去的行为完全不一致,分析团队应该帮助你理解原因。如果他们不能,那就是个问题。

小心有意或无意误导的统计数字。例如,没有“n”大小的百分比或索引可能会使结果看起来比实际情况更极端。此外,不要忘记相关性并不等同于因果关系,过分关注方向性发现会导致你忽视潜在的混淆因素或成为受害者伪相关

当你评估一个分析项目时,不要只是让你的眼睛呆滞于复杂的数学,然后假设这些建议是正确的。花点时间问问题,深入挖掘任何你不懂的地方。很有可能,房间里的其他人会很高兴你问这个问题。

关注Civis Analytics (@CivisAnalytics)及AdEx爱游戏体育骗子changer (@爱游戏体育骗子adexchanger)在Twitter上。

喜欢这个内容吗?

今天就注册成为AdExchange爱游戏体育骗子r会员,就可以无限访问像这样的文章,加上专有数据和研究,会议折扣,按需访问活动内容,等等!

今天加入!

添加一个评论

XHTML:你可以使用这些标签:< a href = " "标题= " " > <简写的标题= " " > <缩写标题= " " > < b > <引用引用= " " > <引用> <代码> < del datetime = " " > < em > <我> <问引用= " " > <年代> <罢工> < >强