在秩相关系数的背景下,绑定数据是什么?


16

我不在统计领域。

在阅读有关秩相关系数时,我已经看到“绑定数据”一词。

  • 什么是捆绑数据?
  • 绑定数据的示例是什么?

Answers:


5

表示具有相同值的数据;例如,如果您有1,2,3,3,4作为数据集,则这两个3是绑定数据。如果您具有1,2,3,4,5,5,5,6,7,7作为数据集,那么5和7就是绑定数据。


14

在基于等级的非参数统计检验的背景下出现“关联数据”。

非参数测试:不假设特定概率分布的测试,例如,不假设钟形曲线。

基于等级的:大量的非参数测试通过将数字(例如“ 3天”,“ 5天”和“ 4天”)转换为等级(例如“最短持续时间(第3次)”,“最长持续时间”)开始(1st)”,“第二最长持续时间(2nd)”)。然后将传统的参数测试方法应用于这些等级。

绑定数据是一个问题,因为现在需要将相同的数字转换为等级。有时会随机分配等级,有时会使用平均等级。最重要的是,为了提高结果的可重复性,需要描述打破平局的协议。


5

它只是两个相同的数据值,例如在同一数据集中两次观察7。

这是在统计方法的上下文中提出的,该方法假定数据具有连续性,因此不可能进行相同的测量(或者从技术上讲,概率相同的值为零)。当将这些方法应用于舍入或修剪的数据时,实际的复杂性就会出现,从而使相同的测量不仅可能而且相当普遍。


1
我不同意这种推理,因为您不能说此事件永远不会发生的可能性为零。这不是一个很好的推理。
Henry.L 2015年

2

这个问题具有根本的重要性:

什么是绑定的观察值/数据/对?

T+

(因此,我不认为@ Ming-Chih Kao的答案首先通过引入非参数检验是正确的。但是由于标题为“在秩相关系数的背景下绑定数据是什么?”,所以我将其购买。)

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

让我们尝试一种非常简单的方法,我们从左到右进行排名并给出:

Ri

|Zi|

Ri

|Zi|

Ri

|ž一世|=1个|ž一世|=2

1个++77=48+92=8.5

[R一世

这修改了排名,并使每个绑定的观察在计算排名统计量时具有相同的影响,因此在排名测试中也是如此。

绑定观察/数据/对有什么解决方案?

(1)指定平均等级。这就是我们上面所做的。通过为同一组中的绑定数据分配相同的等级,我们使它们在排名测试中的影响完全相同,因此消除了由绑定观测值引起的可能的不准确性。

中号一种X[R一种ñķF一世[RsŤG[RØüp<中号一世ñ[R一种ñķsËCØñdG[RØüp 因为如果 中号一种X[R一种ñķF一世[RsŤG[RØüp>中号一世ñ[R一种ñķsËCØñdG[RØüp,这违反了排名法;如果中号一种X[R一种ñķF一世[RsŤG[RØüp=中号一世ñ[R一种ñķsËCØñdG[RØüp,那么我们必须将两个绑定的组合并为一个。

(3)数据的扰动。这需要非常仔细地考虑数据的性质。仅当数据不是分类(离散)数据时才有效。在上面的示例中,我们可以制作一个“ A”。这将为绑定组中的每个元素手动设置不同的权重。例如,对于连续分布,如果干扰ϵ 方式。

(@John D. Cook的回答以这种方式有点误导。一种更好的说法是,当分布是连续的时, PX=X=0。但是,由于我们的测量精度有限,因此我们将保持联系,也就是说,现实中的任何样本空间实际上都是有限的。)(@ quarkdown27的答案很简单,但每个单词都是正确的。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.