Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

2
鲁棒线性模型中的加权
我R使用rlm()MASS软件包中的MM权重估计了一个鲁棒的线性模型。“ ”没有为模型提供值,但是如果它是有意义的数量,我希望有一个。我也很想知道是否有一个值以稳健回归中的观测值加权的方式加权总和剩余方差是否有意义。我的一般想法是,如果出于回归的目的,我们实际上是在权重上给予某些估计值较少的影响,因为它们在某种程度上是离群值,那么也许出于计算的目的,我们也应该给出那些相同的估计影响较小?[R2[R2R^2[R2[R2R^2[R2[R2r^2 我为和加权编写了两个简单的函数,它们在下面。我还包括了为模型HI9运行这些功能的结果。编辑:我找到了UNSW的Adelle Coster的网页,该网页提供了一个公式,其中包括权重向量,这与我计算时一样,并要求她提供更正式的参考:http://web.maths。 unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html(仍在向Cross Valided寻求有关如何解释此加权。[R2[R2R^2[R2[R2R^2R2SSeSSt[R2[R2r^2 #I used this function to calculate a basic r-squared from the robust linear model r2 <- function(x){ + SSe <- sum((x$resid)^2); + observed <- x$resid+x$fitted; + SSt <- sum((observed-mean(observed))^2); + value <- 1-SSe/SSt; + return(value); + } r2(HI9) [1] 0.2061147 #I used this function …

1
计算和绘制LDA决策边界的图形
我从《统计学习的要素》中看到了带有决策边界的LDA(线性判别分析)图: 我知道数据被投影到较低维的子空间上。但是,我想知道我们如何在原始维度上获得决策边界,以便可以将决策边界投影到较低维度的子空间上(如上图中的黑线)。 是否可以使用公式来计算原始(较高)维度中的决策边界?如果是,那么此公式需要哪些输入?


1
在R(nnet程序包)中获取“ multinom”的p值
如何使用package中的multinom函数获取p值?nnetR 我有一个数据集,其中包含作为结果变量的“病理学评分”(不存在,轻度,严重)和两个主要影响:年龄(两个因素:二十天/三十天)和治疗组(四个因素:感染者没有ATB;感染者+ ATB1;已感染+ ATB2;已感染+ ATB3)。 首先,我尝试拟合序数回归模型,鉴于我的因变量(序数)的特征,这似乎更合适。但是,(图形上)严重违反了赔率比例的假设,这促使我改用多项式模型,而是使用nnet软件包。 首先,我选择了需要用作基线类别的结果级别: Data$Path <- relevel(Data$Path, ref = "Absent") 然后,我需要为自变量设置基线类别: Data$Age <- relevel(Data$Age, ref = "Twenty") Data$Treat <- relevel(Data$Treat, ref="infected without ATB") 该模型: test <- multinom(Path ~ Treat + Age, data = Data) # weights: 18 (10 variable) initial value 128.537638 iter 10 value 80.623608 final …

1
R中的glm如何处理'NA'值
我有一个数据表T1,其中包含近一千个变量(V1)和大约2亿个数据点。数据稀疏,大多数条目均为NA。每个数据点都有唯一的ID和日期对,以区别于另一个。 我有另一个表T2,其中包含一组单独的变量(V2)。该表还具有ID和日期对,用于唯一标识T2中的条目。 我们怀疑T1中的数据可用于预测T2中的变量值。 为了证明这一点,我想在R中应用'glm'模型,并检查我们是否真的可以在T2中找到一些依赖于T1中变量的变量。 对于T2中的每个变量,我开始提取T1中具有相同ID和日期对的所有数据,这导致某些测试变量的数据点小得多,约50K。 我现在使用glm面临的问题如下。 在某些情况下,它向我显示错误“找不到适合”和警告“ glm.fit:算法未收敛”。我不确定为什么会显示它? 如何在glm中处理NA?是否先删除所有涉及“ NA”的记录,然后进行拟合? 首先删除所有NA,然后调用“ glm”是一个好策略吗?我担心这可能会大大减少数据点,因为它们中的大多数都是NA。 使用哪种方法来计算系数。我找不到任何讨论输出计算方式的网站,论文或书籍。 我测试了带有和不带有“ NA”的glm,并找到了不同的答案,这表明在拟合数据时要考虑NA: 范例1: > tmpData x1 x2 x3 Y 1 1 1 1 3 2 1 0 4 5 3 1 2 3 6 4 0 3 1 4 Call: glm(formula = as.formula(paste(dep, " ~ ", paste(xn, …

2
分类预测因子在逻辑回归中的意义
我在解释逻辑回归时无法解释类别变量的z值。在下面的示例中,我有3个类别的分类变量,根据z值,CLASS2可能是相关的,而其他则不相关。 但是现在这是什么意思呢? 我可以将其他班级合并成一个班级吗? 整个变量可能不是一个好的预测指标? 这仅是一个示例,此处的实际z值并非来自实际问题,我对其解释有困难。 Estimate Std. Error z value Pr(>|z|) CLASS0 6.069e-02 1.564e-01 0.388 0.6979 CLASS1 1.734e-01 2.630e-01 0.659 0.5098 CLASS2 1.597e+00 6.354e-01 2.514 0.0119 *


3
解释“混合模型”的三种形式
有一个区别让我迷上了混合模型,我想知道我是否可以对此有所了解。假设您有一个计数数据的混合模型。有一个您要用作固定效果的变量(A)和另一个时间(T)变量,按“站点”变量分组。 据我了解: glmer(counts ~ A + T, data=data, family="Poisson") 是固定效果模型。 glmer(counts ~ (A + T | Site), data=data, family="Poisson") 是随机效应模型。 我的问题是,当您遇到以下情况时: glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")什么是T?这是随机效应吗?固定效果?将T放在两个地方实际上完成了什么? 什么时候仅应在模型公式的“随机效应”部分中显示?



8
用R聚类混合数据
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 我想知道是否可以在R中执行具有混合数据变量的数据聚类。换句话说,我有一个同时包含数值和分类变量的数据集,我正在寻找对其进行聚类的最佳方法。在SPSS中,我将使用两步式群集。我想知道是否可以在R中找到类似的技术。有人告诉我有关poLCA软件包的信息,但我不确定...

1
引导程序分布的标准误差的使用
(如果需要,请忽略R代码,因为我的主要问题是与语言无关) 如果我想看一个简单统计量的可变性(例如:均值),我知道我可以通过以下理论来做到这一点: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) 或使用类似的引导程序: library(boot) # Estimate standard error from bootstrap (x.bs = boot(x, function(x, inds) mean(x[inds]), 1000)) # which is simply the standard *deviation* of the bootstrap distribution... sd(x.bs$t) 但是,我想知道的是,在某些情况下查看引导程序分布的标准错误是否有用/有效?我正在处理的情况是一个相对嘈杂的非线性函数,例如: # Simulate dataset set.seed(12345) …

1
R中的多重中介分析
我想知道是否有人知道在R中运行多重中介模型的方法。我知道中介包允许使用多个简单中介模型,但是我想运行一个模型,该模型可以同时评估多个中介模型。 我以为我可以在SEM框架(路径分析)中做到这一点,但想知道是否有一个软件包的新成员能够计算出多个中介者的典型中介统计数据(间接影响,通过中介的总影响比例等),并可以利用引导程序。我知道这是一个长远目标,但我想我应该花点时间从头开始开发。 更新:(11/11/2013) 自从几年前提出这个问题以来,我已经学会了使用出色的R包lavaan进行多种调解。 这是示例代码: model <- ' # outcome model outcomeVar ~ c*xVar + b1*medVar1 + b2*medVar2 # mediator models medVar1 ~ a1*xVar medVar2 ~ a2*xVar # indirect effects (IDE) medVar1IDE := a1*b1 medVar2IDE := a2*b2 sumIDE := (a1*b1) + (a2*b2) # total effect total := c + (a1*b1) …

3
lm()和rlm()有什么区别?
我刚刚rlm() 在MASS库中找到“线性模型的稳健拟合” 功能。 我想知道此函数和标准线性回归函数之间的区别lm()。 有人可以给我一个简短的解释吗?
19 r  regression 

2
针对两个受试者内因素在R中使用lme / lmer进行重复测量ANOVA
我正在尝试lme从nlme软件包中复制aov重复测量方差分析的结果。对于单因素重复测量实验和具有一个受试者间因素和一个受试者内因素的两因素实验,我已经做到了,但是对于在两个因素内的两个因素实验,我却遇到了麻烦主题因素。 一个例子如下所示。A和B是固定效应因子和subject是随机效应的因素。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same as …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.