删节和截断有什么区别?


30

在《生命周期数据的统计模型和方法》一书中,它写为:

审查:由于某种随机原因导致观察不完整时。
截断:当观察结果的不完全是由于研究设计所固有的系统选择过程而导致的。

截断定义中的“研究设计固有的系统选择过程”是什么意思?

删节和截断有什么区别?


3
看一下这里的答案。
Dimitriy V. Masterov 2015年

3
审查:“我们在该地区某处进行了观测,但我们不知道它是什么。” 截断:“观察?什么观察?”
Glen_b-恢复莫妮卡2015年

您的定义来自哪里?
Glen_b-恢复莫妮卡2015年

1
@Glen_b我已经编辑了我的问题。
ABC

Answers:


57

定义各不相同,并且这两个术语有时可互换使用。我将尝试使用以下数据集解释最常见的用法:

11.25245

审查一些意见将受到审查,这意味着我们只知道他们是低于(或高于)一些约束。例如,如果我们测量水样中化学物质的浓度,则会发生这种情况。如果浓度太低,则实验室设备无法检测到化学物质的存在。虽然它可能仍然存在,所以我们只知道浓度低于实验室的检测极限。

<1.5<1.5245,

截断生成数据的过程只能观察到超出(或低于)截断极限的结果。例如,如果使用检测器进行测量,就会发生这种情况,只有当检测器检测到的信号超过一定限制时才会激活。可能会有很多微弱的输入信号,但是我们永远无法分辨使用此检测器。

245

因此,如果我们考虑该词的非技术用途,那么在这种术语的使用上,“审查”会产生误导?也就是说,从统计意义上讲,它的意思是“模糊”或“仅已知处于某个范围内”,而不是非技术意义上的意思-即被抑制或删除,就像一本书从商店中删除时那样,其内容。
火星

3
作为截断的一个具体示例,汽车保险公司从未听说过损失少于免赔额的事故,因为人们没有在那里举报。这是左截断;我们根本看不到这些事件的数据。以正确的检查为例,当一个患病的患者决定停止看医生或搬到另一个城市时,所知道的只是他们离开的那天还活着,但是我们不知道他们何时去世。 。
David White

@火星:我同意这听起来与现代的非技术用法是相反的,在现代的非技术用法中,“审查”消除了所有痕迹,“截断”消除了细节。但是在统计资料中,“检查”用在较老式的非技术意义上,在这种情况下,检查员可以删除但不能消除任何痕迹:黑匣子或照片或视频中令人反感的部分模糊不清,遮盖亵渎的声音在广播中,或者在士兵给家庭的回信或机密文件发行中,删去了经过审查(更现代的术语“编辑过的”)部分。
韦恩

想象一下,我测量了两种事件之间的时间间隔。但是我只能记录1年的事件。时间会被删减吗?
skan

4

正如从另一个领域(编程)的角度来看,审查和截断是两个不同的操作。

当敏感数据集中工作,例如社会安全号码和电话号码,我可能会审查它还是有它审查被授予之前访问:

123-12-1234 => 999-99-9999
567-56-5678 => 999-99-9999
(906) 123-4567 => (000) 000-0000

这使应用程序的其余部分能够以类似的数据结构正常运行,但没有真实的信息内容或私人信息的传播。

相反,截断通常只是在某个点之后截取剩余值。要在一个应用程序上工作,我不需要成千上万条记录,也许每个记录只需要约50条记录,这使得数据访问快得多并且数据集更小。

截断的类似变体是在将值插入长度或精度有限的列或数据类型中时:

abcdefghijklmnopqrstuv => abcdef
10.23412421345 => 10.23
10.92455311 => 10

1
+1重要的是要知道,检查和截断在统计之外可能具有完全不同的含义!
MånsT
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.