5
审查数据到底是什么?
我已经阅读了审查数据的不同描述: A)如该线程中所述,审查低于或高于某个阈值的未量化数据。未量化表示数据高于或低于某个阈值,但我们不知道确切值。然后在回归模型中将数据标记为低阈值或高阈值。它与本演示文稿中的描述相符,我发现它很清楚(第一页的第二张幻灯片)。换句话说,因为我们不知道该范围之外的真实值,所以将YYY限制为最小值,最大值或两者均设为上限。 B)一个朋友告诉我,只要我们至少有一些关于未知Y i结果的极限信息,我们就可以对部分未知的 YYY观测值应用审查数据模型。例如,我们希望基于一些定性标准(商品类型,国家/地区,投标人的财富等)来估计无声拍卖和公开拍卖的最终价格。对于公开拍卖,我们知道所有最终价格Y i,对于无声拍卖,我们只知道第一个出价(例如$ 1,000),而不是最终价格。有人告诉我,在这种情况下,数据是从上方进行审查的,因此应采用审查后的回归模型。YiYiY_iYiYiY_i C)最后是Wikipedia给出的定义,其中YYY完全缺失,但预测变量可用。我不确定此示例与截断的数据有何不同。 那么,检查数据到底是什么呢?