Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

2
nls中具有正确起始值的奇异梯度误差
我正在尝试将线+指数曲线拟合到一些数据。首先,我尝试对一些人工数据执行此操作。该函数为: 它实际上是具有线性截面的指数曲线,以及附加的水平移位参数(m)。但是,当我使用R 函数时,即使使用的参数与最初生成数据时使用的参数相同,也会出现可怕的“ 初始参数估计时的奇异梯度矩阵 ”错误。 我尝试了不同的算法,不同的起始值并尝试使用y=a+b⋅r(x−m)+c⋅xy=a+b⋅r(x−m)+c⋅xy=a+b\cdot r^{(x-m)}+c\cdot xnls()optim最小化剩余平方和,无济于事。我已经读到,可能的原因可能是公式的参数设置过高,但我不认为是(是吗?) 有人对此问题有建议吗?还是这只是一个尴尬的模型? 一个简短的例子: #parameters used to generate the data reala=-3 realb=5 realc=0.5 realr=0.7 realm=1 x=1:11 #x values - I have 11 timepoint data #linear+exponential function y=reala + realb*realr^(x-realm) + realc*x #add a bit of noise to avoid zero-residual data jitter_y = jitter(y,amount=0.2) testdat=data.frame(x,jitter_y) …

3
如何使用带有卡尔曼滤波的DLM进行预测
有人可以引导我看一个有关如何在时间序列上的R中使用DLM卡尔曼滤波的示例。假设我有一个这些值(季度值和年度季节性);您将如何使用DLM预测下一个值?顺便说一句,我是否有足够的历史数据(最小值是多少)? 89 2009Q1 82 2009Q2 89 2009Q3 131 2009Q4 97 2010Q1 94 2010Q2 101 2010Q3 151 2010Q4 100 2011Q1 ? 2011Q2 我正在寻找R代码食谱样式的逐步说明类型的答案。预测的准确性不是我的主要目标,即使我没有足够的数据,我只是想学习能为我提供2011年第二季度数字的代码序列。

4
R中具有自相关误差的简单线性模型
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 8个月前关闭。 如何在R中具有自相关误差的线性模型拟合?在stata中,我将使用prais命令,但找不到R等效项...

2
VAR预测方法
我正在建立一个VAR模型来预测资产价格,并想知道我的方法在统计上是否合理,我所包括的测试是否相关,以及是否需要更多测试以确保基于输入变量的可靠预测。 下面是我当前的检查Granger因果关系并预测所选VAR模型的过程。 require("forecast") require("vars") #Read Data da=read.table("VARdata.txt", header=T) dac <- c(2,3) # Select variables x=da[,dac] plot.ts(x) summary(x) #Run Augmented Dickey-Fuller tests to determine stationarity and differences to achieve stationarity. ndiffs(x[, "VAR1"], alpha = 0.05, test = c("adf")) ndiffs(x[, "VAR2"], alpha = 0.05, test = c("adf")) #Difference to achieve stationarity d.x1 …
19 r  forecasting  modeling  var 

4
处理异方差的最佳方法?
我有一个线性模型的残差值随拟合值的函数关系图,其中异方差非常清楚。但是,我不确定现在应该如何进行,因为据我了解,这种异方差会使我的线性模型无效。(那正确吗?) 使用封装的rlm()功能使用健壮的线性拟合,MASS因为它显然对异方差具有健壮性。 由于我的系数的标准误差由于异方差性而错了,因此我可以调整标准误差以使其对异方差性很强吗?使用此处发布在堆栈溢出上的方法:具有异方差的回归校正的标准错误 哪种方法是解决我的问题的最佳方法?如果我使用解决方案2,那么我对模型的预测能力完全没有用吗? Breusch-Pagan检验确认方差不是恒定的。 我的残差在拟合值的函数中看起来像这样: (较大版本)

1
绘制并解释序数逻辑回归
我有一个序数相关变量,易用性,范围从1(不容易)到5(非常容易)。独立因子值的增加与易用性等级的提高相关。 我的两个自变量(condA和condB)是分类的,每个具有2个级别,而2(abilityA,abilityB)是连续的。 我在R中使用了序数包,它使用了我认为是的 (来自@狞的答案在这里)分对数(p (ÿ⩽ 克))= lnp (ÿ⩽ 克)p (ÿ> 克)= β0G− (β1个X1个+ ⋯ + βpXp)(克= 1 ,… ,k − 1 )Logit(p(ÿ⩽G))=ln⁡p(ÿ⩽G)p(ÿ>G)=β0G-(β1个X1个+⋯+βpXp)(G=1个,…,ķ-1个)\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} - (\beta_{1} X_{1} + \dots + \beta_{p} X_{p}) \quad(g = 1, \ldots, k-1) 我一直在独立地学习这一点,并希望在我仍在努力的过程中提供任何帮助。除了序数包随附的教程外,我还发现以下内容会有所帮助: 序数逻辑回归的解释 有序逻辑回归中的负系数 但是我试图解释结果,并将不同的资源放在一起,并陷入困境。 …

2
拟合R中逻辑增长曲线的最轻松方法是什么?
对于Google来说,这不像其他事情那么容易,因为要明确地说,我并不是在使用回归来预测分类变量的意义上谈论逻辑回归。 我说的是将逻辑增长曲线拟合到给定的数据点。具体来说,是1958年至2012年的给定年份,y是x年11月的估计全球CO2 ppm(百万分之二氧化碳)。XXxÿÿyXXx 目前,它正在加速发展,但必须稳定下来。所以我想要一条逻辑曲线。 我还没有找到一个相对简单的方法来做到这一点。


1
考克斯基线危险
假设我有一个“肾脏导管”数据集。我正在尝试使用Cox模型为生存曲线建模。如果我考虑一个Cox模型:需要估计基准危害。通过使用内置的包R函数,我可以轻松地做到这一点:ħ (吨,ž)= 小时0经验值(b′ž),h(t,Z)=h0exp⁡(b′Z),h(t,Z) = h_0 \exp(b'Z),survivalbasehaz() library(survival) data(kidney) fit <- coxph(Surv(time, status) ~ age , kidney) basehaz(fit) 但是,如果我想针对给定的参数估计值编写基准危害的逐步函数,该b如何进行?我试过了: bhaz <- function(beta, time, status, x) { data <- data.frame(time,status,x) data <- data[order(data$time), ] dt <- data$time k <- length(dt) risk <- exp(data.matrix(data[,-c(1:2)]) %*% beta) h <- rep(0,k) for(i in 1:k) { …
19 r  cox-model  hazard 

1
使用ggplot2在构面中删除未使用的级别
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 去年关闭。 是否可以删除ggplot2s方面未使用的级别?这是我的代码: tab = as.data.frame(cbind(groups = mtcars$cyl, names = row.names(mtcars), val = mtcars$mpg, N = mtcars$disp)) tab$N = as.numeric(tab$N) ggplot(tab, aes(names,val)) + geom_point() + coord_flip() + theme_bw() + facet_grid(groups ~ ., drop=TRUE)#, scales="free", as.table=F, space="free") 我尝试了drop=T开关,但没有帮助。我究竟做错了什么?

4
使用R或SPSS可视化Likert响应
我分为2组(A组为43个,B组为39个),有82位受访者完成了对65个李克特问题的调查,每个问题的范围为1-5(非常同意-非常不同意)。因此,我有一个具有66列(每个问题1个+ 1表示组分配)和82行(每个回答者1个)的数据框。 使用R或SPSS可以使任何人都知道可视化此数据的好方法。 我需要这样的东西:( 来自Jason Bryer) 但是我无法使代码的最初部分起作用。另外,我找到了一个很好的示例,展示了如何从以前的交叉验证帖子中可视化Likert数据:可视化Likert项目响应数据,但是没有有关如何使用R或SPSS创建这些居中计数图或堆积条形图的指南或说明。

7
R中滑动窗口的平均值
我有一个值向量,我想用较小的幻灯片报告窗口中的平均值。 例如,对于具有以下值的向量: 4, 5, 7, 3, 9, 8 窗口大小为3,幻灯片大小为2,将执行以下操作: (4+5+7)/3 = 5.33 (7+3+9)/3 = 6.33 (9+8)/3 = 5.67 并返回这些值的向量: 5.33, 6.33, 5.67 有没有一个简单的函数可以帮我做到这一点?如果它还返回窗口开始的索引,那将是一个额外的好处。在此示例中,该值为1,3,5
19 r 

3
R中丢失数据的完整信息最大可能性
上下文:具有某些缺失数据的层次回归。 问题:如何使用完整信息最大似然(FIML)估计来解决R中的丢失数据?有没有推荐的软件包,典型的步骤是什么?在线资源和示例也将非常有帮助。 PS:我是一名社会科学家,最近刚开始使用R。可以选择多重插补,但是我非常喜欢Mplus之类的程序如何使用FIML优雅地处理丢失的数据。不幸的是,Mplus目前似乎没有在层次回归的情况下比较模型(请告诉我您是否知道这样做的方法!)。我想知道R中是否有类似的东西?非常感谢!


6
线性回归或有序逻辑回归预测葡萄酒等级(从0到10)
我从这里获得了葡萄酒数据,该数据由11个数值自变量组成,每个条目的从属评分与0到10之间的值相关。这使它成为使用回归模型研究变量与关联变量之间关系的绝佳数据集。评分。但是,线性回归是否合适,还是使用多项式/有序逻辑回归更好? 对于特定类别,逻辑回归似乎更好,即没有连续因变量,但(1)有11个类别(有点太多?),(2)经检查,这些类别中只有6-7个数据,即其余5-4类别在数据集中没有示例。 另一方面,线性回归应该线性地估计0-10之间的等级,这似乎更接近我要找出的数值。但是因变量在数据集中不是连续的。 哪种方法更好?注意:我正在使用R进行分析 编辑,解决答案中提到的一些要点: 没有业务目标,因为这实际上是针对大学课程的。任务是分析我认为合适的选择数据集。 收视率的分布看起来很正常(直方图/ qq图)。数据集中的实际值在3到8之间(即使从技术上来说为0到10)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.