Questions tagged «hypothesis-testing»

假设检验评估数据是否与给定假设不一致,而不是随机波动的影响。

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

4
测试正态分布随机变量比率的显着差异
与分析变量的比率有关,以及如何参数化两个正态分布变量的比率或一个变量的倒数?。 假设我有来自四个不同连续随机分布的多个样本,我们可以假设所有这些样本都是大致正态的。在我的情况下,这些对应于两个不同文件系统(例如ext4和XFS)的一些性能指标,无论有没有加密。该指标可能是,例如,每秒创建的文件数,或某些文件操作的平均延迟。我们可以假设从这些分布中抽取的所有样本将始终严格为正。我们称这些分布Perffstype,encryptionPerffstype,encryption\textrm{Perf}_{fstype,encryption} 哪里 fstype∈{xfs,ext4}fstype∈{xfs,ext4}fstype \in \{xfs,ext4\} 和 encryption∈{crypto,nocrypto}encryption∈{crypto,nocrypto}encryption \in \{crypto,nocrypto\}。 现在,我的假设是,加密会使一个文件系统比另一个文件系统减慢的速度更大。对假设是否有一些简单的检验E[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]E[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]\frac{E[\textrm{Perf}_{xfs,crypto}]}{E[\textrm{Perf}_{xfs,nocrypto}]} < \frac{E[\textrm{Perf}_{ext4,crypto}]}{E[\textrm{Perf}_{ext4,nocrypto}]}?

3
对于“假设族”(关于家庭错误率),可能有一个清晰,实用的定义?
尝试评估实验/项目/分析中的假设族的构成时,我发现“目的相似”和“内容相似”作为划定族的指导原则,但这些都为解释提供了很大的开放空间(至少可以说)。 似乎很明显,如果在分析过程中,我对组均值进行了几次检验,对比例均一性进行了另一批检验,那么我就不会将所有东西捆绑在一起成为一个假设家族。 但是,如果我有几批关于组均值的测试,那么什么标准可以将它们组合成一个家庭(或将它们分成不同的家庭)?一个家庭的所有成员都应该具有相同的响应变量吗?如果我的回答变量不同,但涉及的案件相同,那么所有这些都将捆绑成一个假设族吗?

5
非正式/视觉“多次比较”是否需要多次比较校正?
关于何时需要进行多重比较校正,我有一个哲学问题。 我正在测量连续的时变信号(在离散时间点)。有时会发生单独的事件,我想确定这些事件是否对测得的信号有重大影响。 因此,我可以获取事件后的均值信号,通常我可以在某个峰值处看到一些效果。如果我选择了那个高峰的时间,并说出t检验来确定它是否显着,而不是什么时候不发生,我是否需要进行多次比较校正? 尽管我只进行过一次t检验(计算出1个值),但是在我最初的目视检查中,我从绘制的15个不同的后期延迟时间点中选择了具有最大潜在影响的检验。那么我是否需要对从未执行过的15个测试进行多次比较校正? 如果我不使用视觉检查,而只是在每次事件滞后都进行了测试并选择了最高的一次,那么我肯定需要更正。我是否需要根据测试本身以外的其他标准(例如,视觉选择,最高均值等)做出“最佳延迟”选择,这有点困惑


2
测试组之间(某些)分位数Q的差异?
对于某些分为三个组(X)的Y变量,我希望对各组进行比较,并假设所有三个组之间90%的分位数相同。我可以使用哪些测试? 我能想到的一种选择是使用分位数回归,还有其他选择/方法吗? 我想如果我想比较中位数,就可以使用kruskal wallis检验(尽管它是基于等级的,但是如果我没记错的话,当残差分布是对称的时,它也会给出相同的结果) 谢谢。

1
有条件异方差的线性模型的推论
假设我观察到独立变量向量和以及因变量y。我想拟合以下形式的模型: y = \ vec {x} ^ {\ top} \ vec {\ beta_1} + \ sigma g \ left(\ vec {z} ^ {\ top} \ vec {\ beta_2} \ right)\ epsilon, 其中g是某个正值二次可微函数,\ sigma是未知的缩放参数,\ epsilon是零均值,单位方差高斯随机变量(假定独立于\ vec {x}和\ vec {z})。这实质上是Koenker异方差检验的设置(至少据我所知)。x⃗ x→\vec{x}z⃗ z→\vec{z}yyyy=x⃗ ⊤β1→+σg(z⃗ ⊤β2→)ϵ,y=x→⊤β1→+σg(z→⊤β2→)ϵ,y = \vec{x}^{\top}\vec{\beta_1} + \sigma g\left(\vec{z}^{\top} \vec{\beta_2}\right) \epsilon,gggσσ\sigmaϵϵ\epsilonx⃗ x→\vec{x}z⃗ …

4
如何在2 X 3桌子上进行多个事后卡方检验?
我的数据集包括近海,中海道和近海三种地点类型的生物的总死亡率或生存率。下表中的数字表示站点数。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 我想知道根据地点​​类型,发生100%死亡率的地点数量是否显着。如果我运行2 x 3卡方,则会得到显着的结果。我是否可以进行事后成对比较,或者实际上应该使用对数方差分析或二项分布的回归?谢谢!


2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

2
如何测试线性模型中的斜率是否等于固定值?
假设我们有一个简单的线性回归模型并且想针对一般替代性检验零假设。ž= 一个X+ b YZ=aX+bÿZ = aX + bYH0:a = b =1个2H0:一个=b=1个2H_0: a=b=\frac{1}{2} 我认为可以使用和的估计值,并进一步应用检验来获得附近的置信区间。这个可以吗?一个^一个^\hat{a}小号Ë(一个^)小号Ë(一个^)SE(\hat{a})žžZ1个21个2\frac{1}{2} 另一个问题与此密切相关。假设我们有一个样本并且我们计算了统计信息{ (X1个,ÿ1个,ž1个),... ,(Xñ,ÿñ,žñ)}{(X1个,ÿ1个,ž1个),…,(Xñ,ÿñ,žñ)}\{(x_1,y_1,z_1),\ldots ,(x_n,y_n,z_n) \}χ2χ2\chi^2 ∑我= 1ñ(ž一世-X一世+ÿ一世2)2X一世+ÿ一世2。∑一世=1个ñ(ž一世-X一世+ÿ一世2)2X一世+ÿ一世2。\begin{equation} \sum_{i=1}^n \frac{(z_i-\frac{x_i+y_i}{2})^2}{\frac{x_i+y_i}{2}}. \end{equation} 这些统计量可以用于检验相同的原假设吗?

2
比较两种遗传算法
我有两种遗传算法的实现方式,它们应该表现相同。但是,由于无法解决的技术限制,在给定相同输入的情况下,它们的输出并不完全相同。 我仍然想证明没有明显的性能差异。 对于两种算法,我使用相同的配置进行了20次运行,并使用了不同的初始随机数种子。对于每次运行和每一代,记录总体中最佳个体的最小误差 适用度。该算法采用了精英保留机制,因此最佳个人的适合度单调下降。一次运行包含1000代,因此每次运行我都有1000个值。我无法获得更多数据,因为计算非常昂贵。 我应该使用哪种测试?一种简单的方法可能是只比较最后几代中的错误(再次,我将在此处使用哪种测试)?但人们可能还会考虑比较一般的收敛行为。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.