我有两个严重偏斜的样本,正在尝试使用自举比较t统计量的均值。
正确的做法是什么?
我正在使用的过程
当我知道原始数据或观察到的数据不是正态分布时,我会担心在最后一步中使用标准误差的适当性。
这是我的步骤:
- 引导程序-随机抽样替换(N = 1000)
- 为每个引导程序计算t统计量以创建t分布:
- 通过获取t分布的和百分位数来估计t置信区间
通过以下方式获取置信区间:
,其中- 查看置信区间落在哪里,以确定均值是否存在显着差异(即非零)
我也查看了Wilcoxon秩和,但由于分布严重偏斜(例如,第75个== 95%),因此给出的结果并不十分合理。因此,我想进一步探讨自举t检验。
所以我的问题是:
- 这是合适的方法吗?
- 当我知道观测到的数据严重偏斜时,使用SE合适吗?
样本有多大?
—
Michael M
@Michael Mayer大约800
—
CatsLoveJazz 2014年