有一个吗?
我能找到的所有定义都描述了数据的大小,复杂性/多样性或速度。
维基百科的定义是我找到的唯一具有实际数字的定义
大数据量是一个不断变化的目标,从2012年开始,单个数据集中的数据量从几十TB到许多PB。
但是,这似乎与下一段引用的MIKE2.0定义相矛盾,该定义表示“大”数据可能很小,并且仅飞机上创建10GB传感器的3GB数据就可以认为是大数据。
IBM尽管说过:
大数据不仅仅是规模问题。
在定义中强调大小。
奥莱利也强调了 "volume, velocity and variety"
这一点。尽管解释得很好,而且更深入,但该定义似乎是对其他定义的重新混编-当然,反之亦然。
我认为《计算机周刊》的文章标题很好地总结了许多文章“什么是大数据以及如何利用它来获得竞争优势”。
“大数据”是从IT市场的高性能计算领域中冒出来的一个流行语...如果一个人坐在十个技术供应商的演讲中,可能会提出十五个左右的不同定义。当然,每个定义都倾向于支持该供应商的产品和服务的需求。想象一下。
基本上,“大数据”在某种程度上是“大”形状或形式。
什么是“大”?目前可量化吗?
如果“大”是无法量化的,那么是否存在不仅仅依赖于一般性的定义?