Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

1
是否有等效的ARMA用于等级关联?
我正在查看ARMA / ARIMA模型无法很好运行的极非线性数据。虽然,我看到了一些自相关,但我怀疑非线性自相关会有更好的结果。 1 /是否有与PACF相等的等级相关性?(在R中?) 2 /是否存在等效的ARMA模型用于非线性/秩相关(在R?中)



3
在执行Wilcoxon测试之前抖动是错误的吗?
我写了一个脚本,使用来测试数据wilcox.test,但是当我得到结果时,所有p值都等于1。我在一些网站上读到,在测试数据之前,您可能会使用抖动(以避免像他们所说的那样束缚),我做到了,现在我得到了可以接受的结果。这样做是错误的吗? test<- function(column,datacol){ library(ggplot2) t=read.table("data.txt", stringsAsFactors=FALSE) uni=unique(c(t$V9)) for (xp in uni) { for(yp in uni) { testx <- subset(t, V9==xp) testy <- subset(t, V9==yp) zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]])) p.value <- zz$p.value } } } 这是输出 dput(head(t)) structure(list(V1 = c(0.268912, 0.314681, 0.347078, 0.286945, 0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 0.133417, …
9 r  nonparametric  ties 

2
可以使用内核PCA进行功能选择吗?
是否可以以与使用PCA相同的方式将内核主成分分析(kPCA)用于潜在语义索引(LSI)? 我使用prcompPCA功能在R中执行LSI,并从第一个中提取负载最大的功能ķkk组件。这样,我就可以最好地描述组件的功能。 我试图使用该kpca功能(从kernlib包装中获取),但看不到如何访问要素的权重。使用内核方法时,总体上可能吗?

3
R中的正稳定分布
正稳态分布由四个参数描述:偏度参数,比例参数,位置参数等称为索引参数。当为零时,分布在左右对称,当它为正(分别为负)时,分布偏向右侧(分别为向左)当减小时,稳定的分布允许出现胖尾巴。β∈ [ - 1 ,1 ]β∈[-1个,1个]\beta\in[-1,1]σ&gt; 0σ&gt;0\sigma>0μ &Element; (- ∞ ,∞ )μ∈(-∞,∞)\mu\in(-\infty,\infty)α &Element; (0 ,2 ]α∈(0,2]\alpha\in(0,2]ββ\betaμμ\muαα\alpha 当严格小于1并且时,分布的支持范围限制为。αα\alphaβ= 1β=1个\beta=1(μ ,∞ )(μ,∞)(\mu,\infty) 对于参数值的某些特定组合,密度函数仅具有闭合形式的表达式。当,,,和它是(参见式(4.4)这里):μ = 0μ=0\mu=0α &lt; 1α&lt;1个\alpha<1β= 1β=1个\beta=1σ= ασ=α\sigma=\alpha F(y)= -1个πÿ∑∞k = 1Γ (ķ α + 1 )ķ !(-ÿ- α)ķ罪(α ķ π)F(ÿ)=-1个πÿ∑ķ=1个∞Γ(ķα+1个)ķ!(-ÿ-α)ķ罪⁡(αķπ)f(y) = -\frac{1}{\pi y} \sum_{k=1}^{\infty} \frac{\Gamma(k\alpha+1)}{k!} (-y^{-\alpha})^k \sin(\alpha k \pi) 它具有无限的均值和方差。 …

1
R实现部分确定系数
有没有人有建议或一揽子计划来计算部分确定系数? 可以将部分确定系数定义为无法在简化模型中解释的变化百分比,但可以由完整模型中指定的预测变量解释。该系数用于深入了解一个或多个其他预测变量在更完全指定的回归模型中是否有用。 在估计您的两个模型并为它们生成ANOVA表后,部分r ^ 2的计算相对简单。局部r ^ 2的计算为: (减少SSE-减少SSEfull)/减少SSE 我已经编写了这个相对简单的函数,可以为多元线性回归模型计算该函数。我不熟悉R中的其他模型结构,其中该功能可能无法很好地发挥作用: partialR2 &lt;- function(model.full, model.reduced){ anova.full &lt;- anova(model.full) anova.reduced &lt;- anova(model.reduced) sse.full &lt;- tail(anova.full$"Sum Sq", 1) sse.reduced &lt;- tail(anova.reduced$"Sum Sq", 1) pR2 &lt;- (sse.reduced - sse.full) / sse.reduced return(pR2) } 对于完成该任务的更健壮的功能和/或以上代码的更有效实现的任何建议或技巧将不胜感激。
9 r  regression  anova 

1
小波多分辨率分析中的边界效应
有什么方法可以减小小波分解中边界的影响? 我使用R和包wavelim。 我发现例如功能 ?brick.wall 但 我不太使用它。 我不确定最好的解决方案是删除一些系数。我在某处读到它存在一些不一样的小波,并且它们的形状在边界处改变。 有任何想法吗?

4
如何在R中搜索统计过程?
是否有R程序包,网站或命令可以让他们搜索他们想要的特定统计程序? 例如,如果我想找到一个具有Box-Cox转换功能的程序包,则网站/程序包/命令可能会返回“ MASS”并使我转至该boxcox()函数。 使用Box-Cox这样的工具相当简单,但是我希望它可以让我找到更困难的过程,或者通过函数的功能进行搜索(“将列连接到数据框”可能会出现cbind())。是否存在这样的东西?
9 r 

2
我是否正确指定了我的lmer模型?
我搜寻了Google和该站点,但对lme4库中的lmer函数仍然感到困惑。 我从不同的精神病房收集了一些数据,这些数据具有多层次的结构。为简化起见,我将选择两个2级和2个1级变量,尽管实际上我还有几个。 2级-WardSize [这是病房的人数]和WAS [这是病房的“好”程度的一种度量] 告诉R谁在哪个病房中的分组变量称为“ Ward” 一级-性别[很明显是性别]和BSITotal [这是症状严重程度的度量] 结果是自我拒绝,这又是听起来的样子。 我有这个公式: help = lmer(公式= Selfreject〜WardSize + WAS +性别+ BSITotal +(1 | Ward)) 我希望这意味着“每个人的得分都与他们自己的性别和症状的严重程度有关,并且对病房的影响与病房的大小以及病情的“好”程度有关。 它是否正确?使我感到困惑的是,除了最后给出的病房级别截距之外,我看不到R如何分辨哪个是1级和哪个2级变量。 如果有人能解释这个概念,那么像我这样的白痴就可以理解,那就更好了。 非常感谢!

1
Tukey HSD测试如何比未校正的t.test P值更具意义?
我来自“ 双向ANOVA的事后成对比较 ”(对此帖子),它显示了以下内容: dataTwoWayComparisons &lt;- read.csv("http://www.dailyi.org/blogFiles/RTutorialSeries/dataset_ANOVA_TwoWayComparisons.csv") model1 &lt;- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) summary(model1) # Treatment is signif pairwise.t.test(dataTwoWayComparisons$StressReduction, dataTwoWayComparisons$Treatment, p.adj = "none") # no signif pair TukeyHSD(model1, "Treatment") # mental-medical is the signif pair. (输出附在下面) 有人可以解释为什么在配对(未调整的p值)t检验失败时,Tukey HSD能够找到有效的配对吗? 谢谢。 这是代码输出 &gt; model1 &lt;- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) &gt; summary(model1) # Treatment is signif …

7
如何使用R计算400万边缘网络中的集中度度量?
我有一个CSV文件,该文件有400万条有向网络的边缘,代表着彼此通信的人(例如,约翰向玛丽发送消息,玛丽向安发送消息,约翰向玛丽发送另一条消息,等等)。我想做两件事: 查找每个人的度数,本位之间和(也许)本征中心度度量。 获得网络的可视化。 我想在Linux服务器上的命令行上执行此操作,因为我的笔记本电脑没有很多功能。我在该服务器和statnet库上安装了R。我在2009年的这个职位发现某人比我更有能力尝试做同样的事情,并且遇到问题。因此,我想知道是否还有其他人对如何执行此操作有任何建议,最好带我一步一步,因为我只知道如何加载CSV文件,而别无其他。 为了给您一个想法,这是我的CSV文件的外观: $ head comments.csv "src","dest" "6493","139" "406705","369798" $ wc -l comments.csv 4210369 comments.csv

1
nlm()函数中的代码变量
在R中,有一个函数nlm(),它使用牛顿-拉夫森算法使函数f最小化。特别是,该函数输出如下定义的可变代码的值: 编码一个整数,指示优化过程为何终止。 1:相对梯度接近零,可能是电流迭代。 2:在容差范围内进行连续迭代,当前迭代可能是解决方案。 3:最后一个全局步骤未能找到一个低于估计值的点。估计是函数的局部最小值,或者阶跃过小。 4:超出迭代限制。 5:最大步长stepmax连续五次超过。该函数在下面是无界的,或者是从上方在某个方向上逐渐变为有限值,或者stepmax太小。 有人可以针对情况1-5解释我(也许只是使用一个仅带有一个变量的函数的简单图示)吗? 例如,情况1可能对应于以下图片: 先感谢您!
9 r  minimum 

1
使用奇异值分解从线性回归模型计算方差协方差矩阵
我有一个p个回归变量,n个观测值的设计矩阵,并且正在尝试计算参数的样本方差-协方差矩阵。我正在尝试使用svd直接计算它。 我正在使用R,当我取设计矩阵的svd时,我得到三个组件:矩阵为,矩阵为 x(可能是特征值),矩阵为。我将对角化,使其成为非对角线中矩阵。UUUn×pn×pn \times pDDD1×31×31\times 3VVV3×33×33\times 3DDD3×33×33\times 3 假设协方差的公式为:,但是矩阵不匹配,甚至不接近R的内置函数。有没有人有任何建议/参考?我承认我在这方面不熟练。VD2V′VD2V′V D^2 V'vcov
9 r  regression 

3
如何在GLMM中加快固定效果的计算?
我正在进行仿真研究,需要从广义线性混合模型(实际上,是固定效果的两个估算值的一个乘积,一个是GLMM,另一个是LMM的乘积)的自举估计。要做好这项研究,每次大约需要进行1000次或1500次引导复制的1000次模拟。这需要在我的计算机上花费大量时间(很多天)。 How can I speed up the computation of these fixed effects? 更具体地讲,我对对象进行了三种方式的重复测量,从而产生了变量X,M和Y,其中X和M是连续的,而Y是二进制的。我们有两个回归方程 其中Y用于底层潜连续可变和误差不会IID。 我们要引导的统计信息是。因此,每个引导复制都需要安装LMM和GLMM。我的R代码是(使用lme4)中号=α0+α1个X+ϵ1个中号=α0+α1个X+ϵ1个M=\alpha_0+\alpha_1X+\epsilon_1 ÿ∗=β0+β1个X+β2中号+ϵ2ÿ∗=β0+β1个X+β2中号+ϵ2Y^*=\beta_0+\beta_1X+\beta_2M+\epsilon_2∗∗^*ÿÿYα1β2α1β2\alpha_1\beta_2 stat=function(dat){ a=fixef(lmer(M~X+(X|person),data=dat))["X"] b=fixef(glmer(Y~X+M+(X+M|person),data=dat,family="binomial"))["M"] return(a*b) } 我意识到如果我将拟合为线性模型,我将获得相同的估算值,这样可以节省一些时间,但是对于,相同的技巧不起作用。α1α1\alpha_1β2β2\beta_2 我是否只需要购买速度更快的计算机?:)
9 r  mixed-model 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.