就像标题一样,有谁知道一本很好的,最新的书,该书涵盖了一般的数据预处理,尤其是异常检测技术?
这本书并不需要专心于此,但是它应该详尽地处理上述主题-我对以起点为起点的论文感到满意,并引用了一系列论文,对各种技术的解释必须出现在本书中。这本书本身。
处理丢失数据的技术更可取,但不是必需的...
您能告诉我们您正在查看哪种数据(科学领域或测量技术)吗?
—
cbeleites对SX不满意,2012年
从网络用户收集的数据(不能更具体)。包括时间戳(尽管数据至少在直观上与时间不严格相关),分类属性和连续属性。离群值可能是由数不清的原因引起的,包括 网络机器人,恶意用户和许多其他来源。数据也很大(CSV格式的GB,数百万个条目)
—
em70
对我来说,它足够具体:无需对化学或光谱数据集进行预处理……
—
塞贝利特人对SX不满意,2012年