Questions tagged «nonparametric»

使用此标签可以询问非参数方法或参数方法的性质,或两者之间的区别。非参数方法通常依赖于有关基础分布的少量假设,而参数方法则进行了使数据可以由少量参数描述的假设。

1
曼·惠特尼检验中的原假设是什么?
令为分布1的随机值,令为分布2的随机值。我认为曼恩·惠特尼检验的原假设为。X1X1X_1X2X2X_2P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1) 如果我对均值均等且方差相等的正态分布的数据进行的Mann-Whitney检验模拟,则得出的I类错误率非常接近0.05。但是,如果我使方差不相等(但均值相等),则拒绝原假设的模拟比例将大于0.05,这是我没有想到的,因为仍然成立。这发生在我使用的R,不管我是否拥有,或。α=0.05α=0.05\alpha=0.05P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1)wilcox.testexact=TRUEexact=FALSE, correct=TRUEexact=FALSE, correct=FALSE 零假设与我上面写的有所不同吗?或者,如果方差不相等,那么就类型I错误而言,检验是否不准确?

2
非参数回归的最佳特征选择方法
这里有一个新手问题。我目前正在使用R中的np包执行非参数回归。我有7个功能,并使用蛮力方法确定了最好的3个。但是,很快我将拥有7个以上的功能! 我的问题是,当前用于非参数回归的特征选择的最佳方法是什么?以及哪些程序包实现了这些方法。谢谢。

1
高斯过程/狄利克雷过程等随机过程是否具有密度?如果没有,如何对他们应用贝叶斯规则?
Dirichlet Pocess和高斯过程通常被称为“函数分布”或“分布分布”。在那种情况下,我可以有意义地谈谈GP下函数的密度吗?也就是说,高斯过程或Dirichlet过程是否具有概率密度的概念? 如果不是,那么,如果对函数的先验概率的概念没有很好地定义,我们如何使用贝叶斯定律从后验先到?贝叶斯非参数世界中是否存在诸如MAP或EAP估计之类的东西?非常感谢。

3
估计数据概率分布的不同非参数方法
我有一些数据,正在尝试拟合一条平滑曲线。但是,我不想对此施加太大的先验信念或过于强烈的先入之见(我的其余问题所隐含的那些除外)或任何特定的分布。 我只是想用一些平滑的曲线拟合它(或者对它可能来自的概率分布有一个很好的估计)。我知道的唯一方法是内核密度估计(KDE)。我想知道,人们是否知道其他估算此类事物的方法。我只想要它们的列表,然后就可以进行自己的研究以找出要使用的列表。 始终欢迎(并鼓励)提供任何链接或好的参考文献(或关于哪种参考文献的直觉)!

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
蛋白质组学的力量?
赠款通常需要进行功效分析以支持建议的样本量。在蛋白质组学(和大多数组学)中,在10个样本(可能是100个,但不太可能)中测量的特征/变量为100到1000。同样,众所周知,其中一些测量单位(例如,蛋白质的光谱计数)不是正态分布的,因此我们将使用非参数检验进行分析。我已经看到了假设进行单次测量和进行t检验而确定的样本量的功效,但是我认为这是不完全正确的。特别是频谱计数的另一个问题是,每100个特征的比例都在非常不同的尺度上,并且误差相差很大(数值越大,误差就越小)。[这个问题在极限倍数变化模型中很好地描述,Mutch等,2002 ] 考虑到FDR的某些假设和可接受的倍数变化,确定建议样本量的功效的合适方法是什么?使用此处的工具,我能够确定以下各项: 300个基因 3次误报 1.4倍差异 0.8所需功率 0.7标准差 每组需要49个样本。 这很方便,因为我提出了50v50设计,知道1.4倍变化是可以接受的,1%FDR是可以的,并且在这个实验中我可能会测量300种蛋白质。功效或样本数量计算的问题将继续发生,因此最好采用参考方法。 编辑: 我读到一位同事提议使用似然函数和Wald检验从负二项式分布建模光谱计数的地方。基本上使用预备数据来获得蛋白质差异估算值,然后针对每个分位数计算组之间可检测到的倍数变化。还有一个FDR(alpha)输入。因此,给定&gt; 80%的功效并设置样本大小,他们可以针对25%的最低方差,50%的较小方差和25%的最高方差确定可检测的倍数变化。问题是我不知道他们是怎么做到的。不确定是否共享这种方法是否可以帮助任何人找到答案。


2
预订非参数统计
对于非参数统计而言,这将是一本好书。不只是介绍,而是高级。另外,我正在寻找可用于学习而非参考的东西。 特别是我正在寻找一本书,其中可能包含非参数方法,非参数推断,评估非参数的方法(例如KS测试,检验等),自举...的基础知识。ttt

4
何时使用非参数回归?
我在SAS中使用PROC GLM来拟合以下形式的回归方程 ÿ=b0+b1个X1个+b2X2+b3X3+b4Ťÿ=b0+b1个X1个+b2X2+b3X3+b4Ť Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t 产生的残差的QQ图表示偏离正常值。任何变换都无法使残差正常。ÿÿY 此时,我可以安全地切换到非参数方法,例如PROC LOESS。 我已经使用过PROC LOESS,并且看起来比PROC GLM更好。但是我对非参数回归没有太多的了解。我不知道何时选择非参数回归而不是参数回归。 有人可以帮我弄这个吗? 我将继续添加另一个问题。以下是模型中我的变量的描述。 有时我得到负的预测成本。这根本不符合逻辑。我该如何解决这个问题?ÿ= 医疗费用X1个= 注射次数X2= 手术数量X3= 物理疗法的数量t = 时间ÿ=医疗费用X1个=注射次数X2=手术数量X3=物理疗法的数量Ť=时间 Y =\text{cost of medical care}\\ X_1 =\text{number of injections}\\ X_2 =\text{number of surgeries}\\ X_3 =\text{number of physical therapies}\\ t =\text{time}

1
是否有等效的ARMA用于等级关联?
我正在查看ARMA / ARIMA模型无法很好运行的极非线性数据。虽然,我看到了一些自相关,但我怀疑非线性自相关会有更好的结果。 1 /是否有与PACF相等的等级相关性?(在R中?) 2 /是否存在等效的ARMA模型用于非线性/秩相关(在R?中)

3
在执行Wilcoxon测试之前抖动是错误的吗?
我写了一个脚本,使用来测试数据wilcox.test,但是当我得到结果时,所有p值都等于1。我在一些网站上读到,在测试数据之前,您可能会使用抖动(以避免像他们所说的那样束缚),我做到了,现在我得到了可以接受的结果。这样做是错误的吗? test&lt;- function(column,datacol){ library(ggplot2) t=read.table("data.txt", stringsAsFactors=FALSE) uni=unique(c(t$V9)) for (xp in uni) { for(yp in uni) { testx &lt;- subset(t, V9==xp) testy &lt;- subset(t, V9==yp) zz &lt;- wilcox.test(testx[[datacol]],jitter(testy[[datacol]])) p.value &lt;- zz$p.value } } } 这是输出 dput(head(t)) structure(list(V1 = c(0.268912, 0.314681, 0.347078, 0.286945, 0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 0.133417, …
9 r  nonparametric  ties 

4
多向非参数方差分析
我必须分析具有​​五个因子(其中一个嵌套在另一个因子中)和数值响应的析因设计。我想执行非参数方差分析,但是我当然不能同时使用Kruskall Wallis检验和Friedman检验(我已经复制了测度)。R中是否有可以帮助我的命令或代码?谢谢!Stefania

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.