Questions tagged «logistic»

通常指利用逻辑函数的统计程序,最常见的是各种形式的逻辑回归


2
计算逻辑回归的置信区间
我正在使用二项式逻辑回归来确定是否暴露has_x或has_y影响用户点击某事的可能性。我的模型如下: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) 这是我模型的输出: Call: glm(formula = has_clicked ~ has_x + has_y, family = binomial(), data = active_domains) Deviance Residuals: Min 1Q Median 3Q Max -0.9869 -0.9719 -0.9500 1.3979 1.4233 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.504737 …

1
glmnet logistic回归可以直接处理因子(类别)变量而不需要虚拟变量吗?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 3年前关闭。 我正在使用LASSO方法在R中构建逻辑回归,并具有cv.glmnet用于选择lambda和glmnet用于最终模型的功能。 我已经知道关于自动模型选择的所有缺点,但是无论如何我都需要这样做。 我的问题是我需要在模型中包括因子(分类)变量,有什么方法可以在不创建大量虚拟变量的情况下做到这一点?此变量几乎是所有字符串,而不是数字。


1
从exp(系数)到几率及其对数Logistic回归的解释
我根据SAT分数和家庭/种族背景对大学的录取率进行了线性回归。数据是虚构的。这是对先前已回答问题的跟进。这个问题的重点是在为简单起见而撇开SAT分数时收集和解释优势比的方法。 变量是Accepted(0或1)和Background(“红色”或“蓝色”)。我设置了数据,以便具有“红色”背景的人们更容易进入: fit <- glm(Accepted~Background, data=dat, family="binomial") exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit))) Odds_Ratio_RedvBlue 2.5 % 97.5 % (Intercept) 0.7088608 0.5553459 0.9017961 Backgroundred 2.4480042 1.7397640 3.4595454 问题: 0.7是接受“蓝色”背景的人的比例吗?我之所以这样问是因为,Backgroundblue如果我改为运行以下代码,也会获得0.7的“ ”: fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit))) 甲Ç Ç é p 吨ë d / [R ë d :阿Ç Ç é p 吨ë d /乙升ù ë一种CCËpŤËd/[RËd:一种CCËpŤËd/乙升üË\rm …
14 r  regression  logistic 

3
逻辑回归系数有含义吗?
我有几个功能的二进制分类问题。(正规化的)逻辑回归的系数是否具有可解释的含义? 考虑到这些功能已预先标准化,我认为它们可以表明影响的大小。但是,在我的问题中,系数似乎敏感地取决于我选择的特征。甚至系数的符号也会随着选择为输入的不同特征集而变化。 检查系数的值是否有意义,找到最有意义的系数并用词表示其含义的正确方法是什么?某些拟合模型及其系数的符号是​​否错误-即使它们对数据进行排序也是如此? (我在要素之间具有的最高相关性仅为0.25,但这肯定起了作用吗?)

2
McNemar检验与条件逻辑回归之间的关系
我对成对观测中的二进制响应数据建模感兴趣。我们的目的是对小组进行事前干预的有效性进行推断,可能会针对多个协变量进行调整,并确定接受过特别培训的小组作为干预措施的一部分是否会影响效果。 给定以下形式的数据: id phase resp 1 pre 1 1 post 0 2 pre 0 2 post 0 3 pre 1 3 post 0 和一个的配对响应信息列联表:2 × 22×22 \times 2 发布正确不正确的预正确一种C不正确的bd预正确不正确的发布正确一种b不正确的Cd\begin{array}{cc|cc} & & \mbox{Pre} & \\ & & \mbox{Correct} & \mbox{Incorrect} \\ \hline \mbox{Post} & \mbox{Correct} & a & b&\\ & \mbox{Incorrect} …

2
关于逻辑回归的问题
我想运行一个二元logistic回归模型,以在10年内(1997-2006年)从一组自变量中模拟冲突(因变量)的存在与否,每年有107个观测值。我的独立人是: 土地退化(针对两种退化类型); 人口增加(0-否; 1-是); 生计类型(0-1型; 1-2-2型); 人口密度(三种密度水平); NDVI连续(最大蔬菜生产率); NDVI t − 1(比上一年的蔬菜下降-0-否; 1-是)和t−1t−1_{t-1} 和NDVI t − 2(从两年后的蔬菜开始下降-0-否; 1-是)。t−2t−2_{t-2} 我对此很陌生-这是我的讲师给我的一个项目-因此,我将感谢您的一些建议或指导。我已经测试了多大学衔。 本质上,我的数据被划分为107个观测单位(空间区域),覆盖了10年(总共1070年),对于每个观测单位,它给出的是当时该单位内独立变量条件的“快照”值(区域)。我想知道如何设置逻辑回归(或表格)以分别识别每年的107个值,以便可以评估不同单位年之间的时间NDVI变化吗?

2
我可以使用glm算法进行多项式逻辑回归吗?
我在项目中使用Spotfire(S ++)进行统计分析,并且必须对大型数据集运行多项逻辑回归。我知道最好的算法应该是mlogit,但不幸的是,这在s ++中不可用。但是,我可以选择使用glm算法进行回归。我想在这里澄清两件事: 1.我的理解是否正确,glm也可以用于运行多项式逻辑回归? 如果对上一个问题的回答是“是”,那么应在glm算法中使用哪些参数? 谢谢,


4
比较具有不同因变量的模型的逻辑系数?
这是我几天前问的一个后续问题。我觉得它在这个问题上有不同的倾向,因此列出了一个新问题。 问题是:我可以比较具有不同因变量的模型之间的系数大小吗?例如,我只想说一个例子,就是想知道经济是在众议院还是在总统选举中更能预测投票结果。在这种情况下,我的两个因变量将是众议院的投票(民主党代表1,共和党代表0)和总统投票(民主党代表1,共和党代表0),而我的独立变量是经济。我希望两个办公室都能取得统计上的显著成果,但是我如何评估它在两个方面的作用是否更大?这可能不是一个特别有趣的示例,但是我很好奇是否有一种比较方法。我知道不能只看系数的“大小”。所以,有可能比较具有不同因变量的模型上的系数吗?而且,如果是这样,怎么做? 如果这没有任何意义,请告诉我。所有建议和评论表示赞赏。

2
Sane逐步回归?
假设我要构建一个二进制分类器。我有数千个功能,而样本只有几十个。从领域知识来看,我有充分的理由相信仅使用一些功能就可以准确预测类标签,但是我不知道哪个功能可以正确预测。我还希望最终决策规则易于解释/解释,从而进一步需要少量功能。我功能的某些子集高度相关,因此,独立选择最具预测性的几个子集将行不通。我还希望能够对我的功能进行有意义的假设检验。 在这些条件下,以下逐步回归程序是否合理: 给定模型中已经存在的特征(或仅在第一次迭代中截取),选择添加到模型中时产生最大对数似然比的特征。使用似然比卡方检验为在此选择中执行的每个假设检验计算名义P值。这里的无效之处在于,将额外的变量添加到模型中不会提供任何额外的预测能力。另一种选择是,它确实提高了预测能力 将每个迭代的步骤1中测试的假设作为一个族来对待,并使用Benjamini-Hochberg之类的东西为最小P值(针对所选特征)计算错误发现率。 除非满足某些停止条件,否则转到1。 报告对个人特征的错误发现率,但不能用于模型作为一个整体的P值(因为这将是大规模膨胀)。给定先前添加到模型中的所有特征,这些多个测试校正的P值中的每一个均代表该特征的统计显着性。 在这种情况下这样做是否能成功避免所有典型的逐步回归批评?以这种方式计算的错误发现率是否合理?

3
R包用于固定效果逻辑回归
我正在寻找一个R使用Chamberlain的1980年估计量来估计具有单独固定效应(个体截距)的logit模型系数的软件包。它通常被称为张伯伦的固定效应logit估计器。 在处理二进制结果面板数据(至少在计量经济学中)时,这是一个经典的估算器,但我只是在CRAN中找不到与之相关的任何信息。 有什么线索吗?

1
Logistic回归中有无截距模型之间的区别
我想了解逻辑回归中有或没有拦截模型之间的区别 它们之间有什么区别,除了截距系数是相对于基线组的对数(奇数比),无截距系数是相对的(logs)奇数?从我看到的情况来看,两种情况下的系数都相同,但是重要性并不总是相同,并且不明白为什么会这样。此外,在哪些情况下使用无截距的模型是否正确? 这是我的模型:glm(NeverReturn ~ factor(Network) * TotalPrice , family = binomial)而且我不确定是否要保留拦截,因为在“实词”上,总价格无论如何都不能低于50,但是概率是1而不是0,所以我很困惑。

2
Logistic回归预测的输出
我使用以下代码创建了Logistic回归: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) 然后,我使用输出来创建最终模型: final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg + AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 + Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 + IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg + OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg) 然后,我使用了预测函数预测了不同数据集的结果: log.pred.f.v <- …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.