统计和大数据 logistic

1

我有一个关于语义的问题，我希望统计学家能对此发表看法。我们知道诸如logistic，泊松等模型属于广义线性模型。该模型包括参数的非线性函数，然后可以使用适当的链接函数，使用线性模型框架对其进行建模。我想知道您是否考虑（教？）诸如逻辑回归这样的情况：非线性模型，给定参数的形式线性模型，因为链接将我们转换为线性模型框架同时（1）和（2）：“开始”为一个非线性模型，但可以这样一种方式使用，使我们可以将其视为线性模型希望我可以进行一次实际的民意测验...

23 logistic generalized-linear-model poisson-regression nonlinear link-function

2

为什么会有两种不同的逻辑损失表述/符号？

我已经看到两种类型的逻辑损失公式。我们可以轻松地表明它们是相同的，唯一的区别是标签的定义。yyy 公式/符号1，：y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) 其中p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}，其中逻辑函数将实数\ beta ^ T x映射βŤXβŤX\beta^T x到0.1区间。公式/符号2，ÿ∈ { − 1 ，+ 1 }ÿ∈{-1个，+1个}y \in \{-1, +1\}：大号（ÿ，βŤx ）= 对数（1 + 经验（- ÿ＆CenterDot;＆βŤx））大号（ÿ，βŤX）=日志⁡（1个+经验值⁡（-ÿ⋅βŤX）） L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) 选择一种表示法就像选择一种语言一样，使用一种或另一种是有利有弊。这两种表示法的优缺点是什么？我试图回答这个问题的尝试是，统计学界似乎喜欢第一种表示法，而计算机科学界似乎喜欢第二种表示法。第一种表示法可以用术语“概率”来解释，因为逻辑函数将实数βŤXβŤX\beta^Tx为0.1区间。第二种表示法更简洁，可以更轻松地与铰链损失或0-1损失进行比较。我对吗？还有其他见解吗？

23 logistic generalized-linear-model notation loss-functions

1

广义线性模型（GLM）的潜在变量解释

简洁版本：我们知道逻辑回归和概率回归可以解释为涉及一个连续的潜在变量，该变量根据观察之前的某个固定阈值离散化。对于泊松回归，是否可以使用类似的潜在变量解释？当有两个以上的离散结果时，二项式回归（如logit或probit）怎么样？在最一般的层面上，是否有一种方法可以根据潜在变量来解释任何GLM？长版：以下是激发二进制结果的概率模型的标准方法（例如，来自Wikipedia）。我们有一个不可观测的/潜在的结果变量YYY，该变量以预测变量为正态分布XXX。该潜变量经过阈值处理，因此，如果，我们实际观察到的离散结果为，如果，则。这导致给定时的概率采用正态CDF形式，均值和标准差是阈值的函数 ý ≥ γ û = 0 ý < γ Xu=1u=1u=1Y≥γY≥γY \ge \gammau=0u=0u=0Y<γY<γY < \gammau=1u=1u=1XXXγγ\gamma和回归的斜率的。YYYXXX，分别。因此，以概率模型为动力，以此作为根据对潜在回归来估计斜率的一种方法。YYYXXX 下图来自Thissen＆Orlando（2001）。这些作者在技术上从项目响应理论上讨论正常的ogive模型，该模型对于我们的目的而言很像概率回归（请注意，这些作者使用代替，并且概率用代替了通常的）。X Ť Pθθ\thetaXXXTTTPPP 我们可以以几乎完全相同的方式解释逻辑回归。唯一不同的是，现在没有观察到连续遵循物流配送，而不是一个正态分布，给出X。关于为什么的理论论证YYYXXX可能遵循逻辑分布而不是正态分布不太清楚...但是由于实际应用（在重新缩放后）所得的逻辑曲线看起来与正态CDF基本相同，因此可以说是“不会”。在实践中，使用哪种模型往往很重要。关键是两个模型都具有非常简单明了的潜在变量解释。YYY 我想知道我们是否可以将外观相似（或地狱外观不同）的潜在变量解释应用于其他GLM 甚至任何 GLM。即使将上述模型扩展为考虑二项式结果（即，不仅仅是伯努利结果），对我来说也不是很清楚。大概可以通过想象，我们有多个阈值（比观察到的离散结果少一个），而不是只有一个阈值γ来做到这一点。但是我们需要对阈值施加一些约束，例如阈值是均匀分布的。我很确定像这样的东西可以工作，尽管我还没有弄清楚细节。n>1n>1n>1γγ\gamma 对我来说，转向泊松回归的情况似乎还不清楚。我不确定阈值的概念是否将是在这种情况下考虑模型的最佳方法。我也不确定我们可以将潜在结果设想为什么样的分布。最理想的解决方案是用具有某些分布或其他形式的潜在变量来解释任何 GLM 的通用方法-即使该通用解决方案暗示的隐式变量解释与通常的logit / probit回归解释不同。当然，如果通用方法与对logit / probit的通常解释一致，而且自然扩展到其他GLM，那会更酷。但是，即使在一般GLM案例中通常无法使用这种潜在变量解释，我也想听听有关特殊情况（例如我上面提到的Binomial和Poisson案例）的潜在变量解释。参考文献 Thissen，D.＆Orlando，M.（2001）。物品响应理论分为两类。在D.Thissen＆Wainer，H.（编辑）的《测试评分》（第73-140页）中。新泽西州马瓦市：Lawrence Erlbaum Associates，Inc. 编辑2016-09-23 在某种意义上，任何GLM都是潜在变量模型，这就是说我们可以始终将估计的结果分布参数视为“潜在变量”，也就是说，我们不直接观察，例如泊松的rate参数，我们只是从数据中推断出来。我认为这是一个相当琐碎的解释，并不是我真正想要的解释，因为根据这种解释，任何线性模型（当然还有许多其他模型！）都是“潜在变量模型”。例如，在正态回归中，给定正态Y的“潜伏” μμ\muYYYXXX。因此，这似乎将潜在变量建模与仅参数估计混为一谈。例如，在泊松回归的情况下，我正在寻找的东西看起来更像是一个理论模型，它说明了观察到的结果为何首先应该具有泊松分布的情况，并给出了一些假设（由您填写！）。潜在的分布，选择过程（如果有的话）等。然后（也许很关键？），我们应该能够根据这些潜在分布/过程的参数来解释估计的GLM系数，类似于我们如何根据潜在正态变量的均值漂移和/或阈值γ的均值漂移，从概率回归中解释系数。YYYγγ\gamma

21 logistic generalized-linear-model poisson-regression probit latent-variable

2

为不平衡数据的逻辑回归增加权重

我想用不平衡的数据（9：1）对逻辑回归建模。我想尝试glmR函数中的weights选项，但是我不确定100％会做什么。可以说我的输出变量是c(0,0,0,0,0,0,0,0,0,1)。现在我想给“ 1”增加10倍的重量。所以我给出权重的论点weights=c(1,1,1,1,1,1,1,1,1,1,1,10)。当我这样做时，将在最大似然计算中考虑它。我对吗？错误分类“ 1”比错误分类“ 0”仅差10倍。

21 regression logistic classification unbalanced-classes weighted-data

1

解释堵塞物逻辑回归的估计

有人可以建议我如何使用博客链接解释逻辑回归的估算值吗？我已在中安装以下模型lme4： glm(cbind(dead, live) ~ time + factor(temp) * biomass, data=mussel, family=binomial(link=cloglog)) 例如，时间估计为0.015。说单位时间死亡率的几率乘以exp（0.015）= 1.015113（每单位时间增加〜1.5％）是否正确？换句话说，在loglog中获得的估计值是否与logit logistic回归一样以对数赔率表示？

21 logistic regression-coefficients

3

从感知器规则到梯度下降：具有S型激活函数的感知器与逻辑回归有何不同？

本质上，我的问题是在多层感知器中，感知器具有S形激活功能。因此，在更新规则Ÿ计算公式为y^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} 那么，这种“ S型”感知器与逻辑回归有何不同？我要说的是一个单层乙状结肠感知等效于逻辑回归的意义上，二者使用ÿ = 1y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)}更新规则中为 1 + exp （− w T x i）。此外，这两个返回sign(y^=11+exp(−wTxi))sign⁡(y^=11+exp⁡(−wTxi))\operatorname{sign}(\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)})在预测。但是，在多层感知器中，与逻辑回归和单层感知器相比，使用S形激活函数来返回概率，而不是通断信号。我认为“感知器”一词的用法可能有点含糊，所以让我根据对单层感知器的当前理解提供一些背景知识：经典感知器规则首先，是F. Rosenblatt的经典感知器，其中具有阶跃函数： Δwd=η(yi−yi^)xidyi,yi^∈{−1,1}Δwd=η(yi−yi^)xidyi,yi^∈{−1,1}\Delta w_d = \eta(y_{i} - \hat{y_i})x_{id} \quad\quad y_{i}, \hat{y_i} \in \{-1,1\} 更新权重 wk:=wk+Δwk(k∈{1,...,d})wk:=wk+Δwk(k∈{1,...,d})w_k := w_k + \Delta w_k \quad \quad (k \in \{1, ..., d\}) …

21 logistic classification neural-networks gradient-descent perceptron

1

logistic和logit回归之间有什么区别？

logistic和logit回归之间有什么区别？我知道它们是相似的（甚至是相同的东西），但是有人可以解释这两者之间的区别吗？关于赔率一？

21 regression logistic terminology logit odds

1

Firth Logistic回归模型选择

在我正在使用的小型数据集（）中，几个变量为我提供了理想的预测/分离效果。因此，我使用Firth Logistic回归来处理该问题。ñ 〜100n∼100n\sim100 如果我通过AIC或BIC选择最佳模型，那么在计算这些信息标准时是否应该在可能性中包括Firth惩罚项？

21 logistic model-selection aic separation

2

如何将二项式GLMM（glmer）应用于百分比而不是是-否计数？

我有一个重复测量实验，其中因变量是一个百分比，并且我有多个因素作为自变量。我想glmer从R包中使用lme4它（通过指定family=binomial）作为逻辑回归问题，因为它似乎可以直接容纳此设置。我的数据如下所示： > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 6 1 chrmpeak-tpor1d nr075 1 …

21 r logistic mixed-model glmm lme4-nlme

3

对数线性回归与逻辑回归

谁能提供清晰的对数线性回归与逻辑回归之间的区别的清单？我知道前者是一个简单的线性回归模型，但是我不清楚何时应使用它们。

21 regression logistic logit log-linear

1

时间序列的逻辑回归

考虑到过去的观察，我想在流数据（多维时间序列）的上下文中使用二进制逻辑回归模型，以便预测刚刚到达的数据（即行）的因变量的值。据我所知，逻辑回归通常用于事后分析，因为每个因变量均已设置（通过检查或研究性质）。但是在时间序列的情况下会发生什么，我们要根据历史数据（例如，在最后秒的时间窗口中）（当然是前一个）动态地对因变量进行预测估计因变量？ŤŤt 并且，如果您随着时间的推移看到上述系统，应该如何构建它才能使回归正常工作？我们是否必须首先通过标记数据的前50行（即将因变量设置为0或1）来训练它，然后使用向量的当前估计值来估计它的新概率？因变量是刚到达的数据的0或1（即刚添加到系统的新行）？ββ{\beta} 为了使我的问题更清楚，我尝试建立一个系统来逐行解析数据集，并在给定所有先前因果关系或解释性知识（观察或估计）的情况下，对二进制结果（因变量）进行预测到达固定时间窗口的变量。我的系统在Rerl中，并使用R进行推断。

21 r time-series logistic

3

当交互作用不显着时，如何解释主要作用？

我在R中运行了广义线性混合模型，并包括了两个预测变量之间的相互作用。交互作用并不显着，但主要影响（两个预测因素）均如此。现在，许多教科书示例告诉我，如果交互作用显着，则主要作用无法解释。但是，如果您的互动不重要怎么办？我是否可以得出结论，这两个预测因素会对响应产生影响？还是在不进行交互的情况下运行新模型更好？我不想这样做，因为那样我就必须控制多个测试。

21 logistic mixed-model interaction interpretation regression-coefficients

4

如何知道数据是否可以线性分离？

数据具有许多功能（例如100个），实例数量大约为100,000。数据稀疏。我想使用逻辑回归或svm拟合数据。我如何知道要素是线性的还是非线性的，以便在非线性的情况下可以使用内核技巧？

21 machine-learning logistic svm data-mining

1

是否有逻辑上的解释说明为什么逻辑回归不适用于完美分离的情况？以及为什么添加正则化将解决此问题？

关于逻辑回归中的完美分离，我们有很多很好的讨论。例如，R中的逻辑回归导致完美的分离（Hauck-Donner现象）。怎么办？和Logistic回归模型不收敛。我个人仍然觉得这为什么会是一个问题以及为什么添加正则化可以解决这个问题并不直观。我制作了一些动画，并认为这会有所帮助。因此，请亲自发布他的问题并回答，以便与社区分享。

20 logistic generalized-linear-model optimization intuition separation

3

机器学习预测班级概率

我正在寻找可输出示例属于两个类之一的概率的分类器。我知道逻辑回归和朴素的贝叶斯，但是您能告诉我其他类似的工作方式吗？也就是说，分类器不是预测示例所属的类，而是预测示例适合特定类的概率吗？您可以分享关于这些不同分类器（包括逻辑回归和朴素贝叶斯）的优缺点的任何想法的加分。例如，对于多类别分类是否有更好的选择？

20 machine-learning probability logistic classification naive-bayes

Questions tagged «logistic»