6
数据集了解最佳实践
我是数据挖掘的CS硕士学生。我的主管曾经告诉我,在运行任何分类器或对数据集执行任何操作之前,我必须完全理解数据,并确保数据干净无误。 我的问题: 理解数据集(具有数值和名义属性的高维)的最佳实践是什么? 如何确保数据集干净? 是否要确保数据集没有错误值?
数据集是通常以表格或矩阵形式的数据集合。此标记不适用于数据请求(“我在哪里可以找到有关...的数据集”)->请参见OpenData