大数据到底是什么?
我曾多次被问到这个问题: 什么是大数据? 学生和我的亲戚都开始关注统计和ML。 我找到了这个简历。我觉得我同意唯一的答案。 在维基百科页面也有一些关于它的评论,但我不知道我是否真的与那里的一切同意。 编辑:( 我觉得Wikipedia页面缺少解释解决此问题的方法以及我在下面提到的范例)。 我最近参加了EmmanuelCandès的演讲,他在演讲中介绍了大数据范例 首先收集数据稍后再提问⇒⇒\Rightarrow 这是与假设驱动的研究的主要区别,在假设研究中,您首先拟定了一个假设,然后收集数据对它进行了说明。 他深入探讨了量化由数据监听生成的假设的可靠性的问题。我从他的演讲中学到的主要内容是,我们确实需要开始控制FDR,他提出了仿制方法。 我认为简历应该对什么是大数据以及您对它的定义有疑问。我觉得有很多不同的“定义”,如果对它的组成没有普遍的共识,很难真正掌握它的含义或向他人解释。 我认为Candès提供的“定义/范例/描述”是我最接近的观点,您对此有何看法? EDIT2:我认为答案不仅仅应解释数据本身。它应该是数据/方法/范例的组合。 EDIT3:我认为这次对迈克尔·乔丹的采访也可能会有所帮助。 EDIT4:我决定选择投票率最高的答案作为正确答案。尽管我认为所有答案都有助于讨论,但我个人认为这更多是我们如何生成假设并使用数据的范例问题。我希望这个问题可以为那些寻找大数据的人提供参考。我希望可以更改Wikipedia页面,以进一步强调多重比较问题和FDR的控制。