您如何在工作中管理期望?


22

围绕数据科学,机器学习以及所有成功案例的喧嚣声中,数据科学家及其预测模型的期望既合理又夸张。

我对实践统计学家,机器学习专家和数据科学家的问题是-您如何管理公司内商人的期望,尤其是在模型的预测准确性方面?简单地说,如果您的最佳模型只能达到90%的准确度,而高层管理人员期望的准确率不低于99%,那么您将如何处理此类情况?


1
好问题!但我应该是社区Wiki
Alexey Grigorev 2015年

1
好问题。去过那里,做过(做过):D
Dawny33

Answers:


11

理性的商人不会为准确性付出代价,他们会为其中一项付出代价

  • 在有利可图的过程中省钱(从而使它更有利可图),或者
  • 创造新的钱(创造新的盈利过程)。

因此,所进行的任何项目都必须体现这一点。第一步始终是了解您正在执行的两个过程中的哪个,并且您应该对如何实现这一目标有一个清晰的认识,同时要记住,随着进展的进展,如何执行的细节可能会发生变化。

如果您可以提高流程的准确性,则可以为公司赚钱,而业务人员将为您的进度进行投资。业务人员坚持99%的准确性而拒绝90%的准确性的唯一理性原因是,如果他们已经有一种比90%更好的方法。如果是这样的话,他们当然是有立场的。

以业务人员理解的方式理解和介绍您正在从事的项目的业务案例是任何工程师成熟过程的一部分。尽管数据科学具有一些独特的方面(例如,成熟度较低,但偶然发现偶然性的可能性较高,至少在当今环境中如此),但它并不是数据科学所独有的。

可以在以下位置找到与数据科学相近的相关过程,该步骤使该步骤变得很明确:https : //en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining

但是大多数企业体系结构框架同样适用。


1
做得很好。您的回答将期望与现实区分开来。太棒了!
无题

奇怪的是,这里的赞誉没有得到我的认可。
Mike Wise

10

收集有竞争力的同行。尝试确定最新技术,然后看看您的模型如何与之比较。这在很大程度上还取决于您的团队已经工作了多长时间。科学驱动的模型不是静态创建的,它们是动态发展的,因为优秀的科学家将始终尝试寻找改进方法。

高层管理人员应该知道,数据科学家会探索方法,有时/经常不知道其质量。他们应该知道,机器学习技术不会立即产生完美的模型。如果他们做到了,那反正是挑战。

应该通过他如何证明和讨论他的结果以及他如何计划未来的方式来评估数据科学家。管理人员要满足他们的期望的一种方法是不要拥有过高的期望。

尽管如此,如果在上下文中可以预期得到合理的结果,请考虑以下问题:

  1. 随着时间的推移,结果会有所改善吗?
  2. 未来的期望是积极的吗?
  3. 与同类系统(来自竞争对手)的结果相比,结果如何?

5

我喜欢这个问题,因为它涉及每个组织中存在的政治问题。在我看来,并且在很大程度上,对模型性能的期望取决于组织文化和组织“具备技术素养”的程度。弄清我的意思的一种方法是考虑4个大型“数据科学”实体(Google,FB,Amazon和Yahoo)与4个大型代理控股实体(WPP,Omnicon,Interbrand和Publicis)之间的区别。Google等人精通技术。另一方面,众所周知,这些机构倾向于技术恐惧症。有什么证据呢?首先,具有技术素养的小组是由工程师,计算机科学家,极客和具有深厚技术背景的人创立或运营的。谁经营技术落后的公司?凭借出色的沟通能力和人际交往能力而声名显赫的营销人员。而且不仅如此,我在纽约的一些商店工作过,还可以证明这些组织系统地惩罚和/或推出了技术水平高的类型,而不是“不适合”这种文化。接下来,考虑他们的总(股票)市值,技术素养集团总计约8000亿美元,而技术素养集团总计800亿美元。具有技术素养的实体市值比其他实体大10倍。这是对市场期望的明确说明,对文盲者来说并不算高。因此,通过推断,您可以对挑战像这样的bozo的“预测准确性”期望产生什么样的希望?我曾在纽约的一些商店工作过,因此我可以证明,这些组织系统地惩罚和/或推出了具有高技术素养的类型,而不是“不适合”这种文化。接下来,考虑他们的总(股票)市值,技术素养集团总计约8000亿美元,而技术素养集团总计800亿美元。具有技术素养的实体市值比其他实体大10倍。这是对市场期望的明确说明,对文盲者来说并不算高。因此,通过推断,您可以对挑战像这样的bozo的“预测准确性”期望产生什么样的希望?我曾在纽约的一些商店工作过,因此我可以证明,这些组织系统地惩罚和/或推出了具有高技术素养的类型,而不是“不适合”这种文化。接下来,考虑他们的总(股票)市值,技术素养集团总计约8000亿美元,而技术素养集团总计800亿美元。具有技术素养的实体市值比其他实体大10倍。这是对市场期望的明确说明,对文盲者来说并不算高。因此,通过外推法,您对挑战像这样的bozo的“预测准确性”期望有什么样的希望?考虑到他们的总(股票)市值,技术素养群体加起来约为8000亿美元,而技术素养群体则达到800亿美元。具有技术素养的实体市值比其他实体大10倍。这是对市场期望的明确说明,对文盲者来说并不算高。因此,通过推断,您可以对挑战像这样的bozo的“预测准确性”期望产生什么样的希望?考虑到他们的总(股票)市值,技术素养群体加起来约为8000亿美元,而技术素养群体则达到800亿美元。具有技术素养的实体市值比其他实体大10倍。这是对市场期望的明确说明,对文盲者来说并不算高。因此,通过推断,您可以对挑战像这样的bozo的“预测准确性”期望产生什么样的希望?

因此,考虑到文化的突破以及取决于您跌倒的地方,您应该或多或少地具有现实的期望。当然,不同的“技术文盲”实体将拥有知道他们在做什么的经理,但是在大多数情况下,这些实体被技术技能中最低公分母的白痴所支配,即,技术水平最高的人半文盲(并且很危险),或者更常见的情况是完全无数次,但不知道。举个例子,我为一个想要从“高级职员套间”中擦掉“相关”之类的词的人工作。这是一个极端的情况:毕竟,每个秘书都知道什么是“关联”。

这就提出了一个问题,当他们问一个真正愚蠢的问题时,如“为什么您没有获得99%的预测准确度?”,这时人们该如何应对这个疯狂而幼稚和无数的问题。一个很好的回答是回答一个问题,例如“为什么您会认为这样高的PA甚至是可能的?” 另一个可能是,“因为如果我实际上有99%的PA,我会以为自己做错了。” 即使有90%的PA,也很有可能是这样。

还有一个更根本的问题,就是坚持以PA作为模型价值的唯一标准。已故的Leo Breiman在PA就是其中之一的统计和预测建模社区上留下了许多足迹。他对PA的主要关注是解决90年代关于运行单个CART树固有的不稳定性和错误的许多批评。他的解决方案是激发“随机森林”作为一种近似和临时的方法,该方法可以通过消除树结构来最大程度地提高准确性并减少不稳定性。他将约1,000个迭代RF“微型模型”中较低的MSE相对于单个logistic回归模型的误差进行了基准测试。唯一的问题是,他从来没有想过将耀眼的苹果与橘子进行比较:

2008年Netflix奖向任何能够改进其推荐系统的MSE的统计学家或团队提供了可观的金钱奖励。当时,Netflix每年在此系统上花费1.5亿美元,并坚信这些成本比客户忠诚度和购买电影所能收回的成本还要多。最终的获奖者使用了107种不同模型的复杂合奏。

然而,正如Netflix所了解的那样,真正的问题是,从满负荷的成本角度来看,与当前模型相比,错误的实际改善是5分评级仅降低了0.005%。更不用说IT时间的花费,繁重的维护和107个模型的获胜组的维护,远远超过了减少错误所带来的任何收益。鉴于此,Netflix最终放弃了对MSE的追求,不再授予Netflix奖

这就是要点:可以轻松地对预测误差进行最小化或p-hack,并且容易导致分析师欺诈(即,找到一种解决方案,可以美化分析师的建模技能,从而积极影响其潜在的年终奖金)。而且,它是在经济和商业真空中设定的完全统计解决方案和目标。该指标很少或根本没有考虑附属的附带成本-从A到Z评估的非常实际的运营后果,应该是任何基于权衡的满负荷决策过程的组成部分。

这已经成为组织中嵌入的问题之一,并且很难更改。换句话说,我完全意识到我在风车上对使用PA的注意事项之以鼻。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.