Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

1
非嵌套模型的测试等效性
假设是和虚拟d的线性函数。我的假设是d本身就像其他变量Z的向量的享乐主义索引。我有一个这种支持MANOVA的ž(即Z_1,Z_2,...,z_n)上d。有什么方法可以测试这两个模型的等效性:yyyxxxddddddZZZMANOVAMANOVAMANOVAZZZz1z1z_1z2z2z_2znznz_nddd 模型1:y=b0+b1⋅x+b2⋅d+e1y=b0+b1⋅x+b2⋅d+e1y = b_0 + b_1 \cdot x + b_2\cdot d + e_1 模型2:y=g0+Z⋅G+e2y=g0+Z⋅G+e2y = g_0 + Z\cdot G + e_2 其中GGG是参数的列向量。

3
处理三级列联表的适当方法
我有一个三级列联表,其中包含几种物种的计数数据,收集它们的寄主植物以及该收集是否在下雨天发生(这实际上很重要!)。使用R,假数据可能是这样的: count <- rpois(8, 10) species <- rep(c("a", "b"), 4) host <- rep(c("c","c", "d", "d"), 2) rain <- c(rep(0,4), rep(1,4)) my.table <- xtabs(count ~ host + species + rain) , , rain = 0 species host a b c 12 15 d 10 13 , , rain = 1 species …


4
用R分析风数据
嗨,我正在分析风数据以估算风力涡轮机的能量。 我已经收集了10年的风力数据并绘制了直方图。 我的第二阶段是将Weibull分布拟合到数据。 我将R与包装lmom一起使用以计算Weibul形状并缩放,这是我使用的代码: >library(lmom) wind.moments<-samlmu(as.numeric(pp$WS)) moments<-pelwei(wind.moments) x.wei<-rweibull(n=length(pp$WS), shape=moments["delta"], scale=moments["beta"]) hist(as.numeric(pp$WS), freq=FALSE) lines(density(x.wei), col="red", lwd=4) 数据和密度函数之间似乎有些滞后。你能帮我吗?另一个问题是您可以帮助我根据密度函数计算年能量吗? 谢谢
12 r  distributions 

4
设置Sweave,R,Latex,Eclipse StatET [关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 3年前关闭。 几天前,我看到了一篇有关如何设置SweaveR的文章,该文章使用户可以将表格,图形等内容直接导出到Latex中。我不能完全按照指示进行。 任何人都可以在Mac和Windows上逐步说明如何执行此操作吗?
12 r 

2
剖分方差分析:R中的模型比较测试
如何使用R中的X和M参数使用合适的模型比较来测试分割图方差分析中的效果anova.mlm()?我熟悉?anova.mlmDalgaard(2007)[1]。不幸的是,它只能刷分割图设计。在具有两个受试者内部因素的完全随机设计中进行此操作: N <- 20 # 20 subjects total P <- 3 # levels within-factor 1 Q <- 3 # levels within-factor 2 DV <- matrix(rnorm(N* P*Q), ncol=P*Q) # random data in wide format id <- expand.grid(IVw1=gl(P, 1), IVw2=gl(Q, 1)) # intra-subjects layout of data matrix library(car) # for Anova() fitA …

1
过滤数据框
仍在学习R中的基本功能,子集功能似乎仅基于基于单个列的条件(有或没有多个条件)进行过滤? 如何轻松地从数据框中过滤数据? 当您有多个条件时 需要在可用列之间应用条件时。 示例:给定一个数据框,其中包含 name D1 D2 D3 D4 julius "A" "A" "B" "B" cate "D" "E" "A" "C" karo "A" "D" "C" "E" 说我想过滤此数据帧,以便仅命名D1到D4中的任何一个为'E'的名称, name D1 D2 D3 D4 cate "D" "E" "A" "C" karo "A" "D" "C" "E" 假设D1可能是一大列列,执行此过滤器的推荐方法是什么?谢谢
12 r 

2
如何对带有随机斜率的混合效应回归模型进行MCMC假设检验?
库languageR提供了一种方法(pvals.fnc),可以使用lmer在混合效果回归模型拟合中对固定效果进行MCMC重要性测试。但是,当lmer模型包含随机斜率时,pvals.fnc会给出错误。 有没有办法对此类模型进行MCMC假设检验? 如果是这样,怎么办?(要被接受,答案应该在R中有一个可行的示例)。如果没有,是否存在无法解决的概念/计算原因? 这个问题可能与此有关,但我对其中的内容了解得不够清楚。 编辑1:概念证明表明pvals.fnc()仍然对lme4模型执行“某些操作”,但对于随机斜率模型则不执行任何操作。 library(lme4) library(languageR) #the example from pvals.fnc data(primingHeid) # remove extreme outliers primingHeid = primingHeid[primingHeid$RT < 7.1,] # fit mixed-effects model primingHeid.lmer = lmer(RT ~ RTtoPrime * ResponseToPrime + Condition + (1|Subject) + (1|Word), data = primingHeid) mcmc = pvals.fnc(primingHeid.lmer, nsim=10000, withMCMC=TRUE) #Subjects are in both …

5
逻辑回归中更好的默认分类
全面披露:这是家庭作业。我提供了指向数据集的链接(http://www.bertelsen.ca/R/logistic-regression.sav) 我的目标是在此数据集中最大程度地预测违约贷款。 到目前为止,我提出的每个模型都预测> 90%的非默认者,但是<40%的默认者使分类效率总体达到80%。那么,我想知道变量之间是否存在交互作用?在逻辑回归中,除了测试每种可能的组合之外,还有没有办法确定潜在的交互作用?或者,一种提高违约者分类效率的方法。 我被困住了,任何建议都会对您选择单词,R代码或SPSS语法有所帮助。 下面的直方图和散点图概述了我的主要变量(二分变量除外) 主要变量的说明: age: Age in years employ: Years with current employer address: Years at current address income: Household income in thousands debtinc: Debt to income ratio (x100) creddebt: Credit card debt in thousands othdebt: Other debt in thousands default: Previously defaulted (dichotomous, yes/no, 0/1) ed: …
12 r  logistic  spss  self-study 

2
R新手的项目分析
我正在尝试评估20个多项选择测试。我想执行一个项目分析,例如在本示例中可以找到的。因此,对于每个问题,我都希望P值以及与总数的相关性以及所选选项的分布。 我对那里的各种统计软件包一无所知,但是我想使用R,因为我对编程很满意并且R是开源的。我设想的伪工作流程是: 在Excel中准备数据并导出为CSV 将数据加载到R中 加载符合我需要的软件包 执行该软件包的命令 导出并报告。 我对1和2充满信心,但对3却有疑问,可能是因为我没有统计词汇来比较我在CRAN上浏览的软件包。 ltm看起来它可能是正确的软件包,但我不知道。无论使用什么软件包,命令将是什么? 附带问题:在链接的示例中,您认为MC和MI代表什么?

3
在计算相关矩阵时,丢弃带有缺失值的观测值是否存在严重问题?
我有2500个变量和142个观测值的庞大数据集。 我想在变量X和其余变量之间运行关联。但是对于许多列,缺少条目。 我尝试使用“成对完成”参数(use=pairwise.complete.obs)在R中执行此操作,并输出了一堆相关性。但是随后StackOverflow上的某人发布了指向本文http://bwlewis.github.io/covar/missing.html的链接,这使R中的“成对完成”方法显得无法使用。 我的问题:我怎么知道什么时候适合使用“成对完成”选项? 我use = complete.obs回来了no complete element pairs,所以如果您能解释一下这也意味着什么,那就太好了。


3
如何在R中使用betareg函数实现混合模型?
我有一个数据集,其中包含一些比例,这些比例用于测量个体t的“活动水平”,因此使值介于0和1之间。该数据是通过计算个体在特定时间间隔内移动的次数(移动为1, 0(表示不移动),然后取平均值以为每个人创建一个值。我的主要固定效果是“密度水平”。 我面临的问题是,我有一个因子变量“ pond”,我想将其作为随机效应包括在内-我不在乎池塘之间的差异,但希望从统计角度考虑它们。关于池塘的重要一点是,我只有3个,而且我了解在处理随机效应时理想的是具有更多的因子水平(5+)。 如果可能的话,我希望获得一些有关如何使用R betareg()或betamix()在R中实现混合模型的建议。我已经阅读了R帮助文件,但是我通常很难理解它们(每个参数在上下文中的真正含义是什么)我自己的数据以及输出值对生态意义的含义),因此我倾向于通过示例更好地工作。 在相关的说明中,我想知道是否可以代替使用glm()二项式族和logit链接来解决此类数据的随机影响。

1
Logistic损失函数的梯度
我想问一个与此有关的问题。 我在这里找到了为xgboost编写自定义损失函数的示例: loglossobj <- function(preds, dtrain) { # dtrain is the internal format of the training data # We extract the labels from the training data labels <- getinfo(dtrain, "label") # We compute the 1st and 2nd gradient, as grad and hess preds <- 1/(1 + exp(-preds)) grad <- preds …

1
哪种是网络荟萃分析的最佳方法?
现在有几种不同的方法可以进行网络荟萃分析或混合治疗比较。 最常用和可访问的可能是以下几种: 在贝叶斯框架中: WinBUGS中的按处理设计交互方法(例如Jackson等); WinBUGS中基于手臂的分层贝叶斯建模(例如Zhao等); 分层对比度为基础(即,节点分裂)贝叶斯建模,无论是与WinBUGS软件或通过gemtc与rjags在R(例如Dias等或货车Valkenhoef等人); WinBUGS中的集成嵌套拉普拉斯近似(INLA)(例如Sauter等); 在常客框架中: SAS的因子分析方差分析(例如Piepho); SAS中的多层次网络荟萃分析(例如Greco等); mvmeta在Stata或R中的多元元回归(例如White等); lme和netmetaR中进行网络荟萃分析(例如Lumley,但仅限于两臂试验,或Rucker等)。 我的问题很简单:它们大致相等还是在大多数情况下更适合进行主要分析(因此将其他保留为辅助分析)? 更新 一段时间以来,对网络元分析的方法进行了一些比较分析: Carlin BP,Hong H,Shamliyan TA,Sainfort F,Kane RL。案例研究比较贝叶斯方法和常见方法进行多次治疗比较。医疗保健研究与质量局(美国)。2013。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.