Answers:
没有最大值或最小值。如果离群值是不良数据或出于其他实质性原因将其删除,则应将其删除。如果没有实质性原因,那么我建议使用对异常值具有鲁棒性的方法。我不会删除离群值,因为它们离其他点有点远。
我会强调在其他答案和评论中所说的内容(我认为@Peter Flom的答案是准确的,而EdM在所有测量方面都是正确的)。
分析数据是必须谨慎完成的事情。您必须非常清楚联系人中离群值的含义。例如,假设您的测量过程“正确”完成(我的意思是,您没有引入偏差,您未校准设备,读取仪器的人员正确完成了该操作,等等),有些离群值可能会告诉您一些有趣的事情有时非常重要
这是一个虚构的示例,如果不是在所有方面都100%正确,请放纵(在注释中注明)。;)
假设某人正在测试将一定量的物质应用于某些细菌培养物(种群)的效果。现在,“一般”的作用是稳定种群中细菌的数量,但是不同文化之间存在一些离群值。
想象一下,所有异常值都指示所有细菌都死亡的情况。或者,所有异常值都代表细菌种群失控生长的文化。
我想指出的是,您所感知到的异常值的性质可能是有意义的,并且每种结果的不同。您可能处于无法忍受细菌数量增加或减少的情况。
当然,如果您注意到某些物质被这些物质消灭了,您可能会对此事进行调查,因为这是一种易于识别的情况。但是并非所有现象都易于检测。
总结起来,离群值的概念在某种程度上是任意的,但是其含义是多重的并且具有不同的重要性。希望它能使您对此事进行思考... :)