Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

2
贝叶斯分析的最佳软件包
我想知道你们推荐哪种软件统计软件包来执行贝叶斯推理。 例如,我知道您可以独立运行openBUGS或winBUGS,也可以从R调用它们。但是R也有几个自己的软件包(MCMCPack,BACCO)可以进行贝叶斯分析。 是否有人对R中的哪个贝叶斯统计软件包最好或其他替代方案(Matlab或Mathematica)有任何建议? 我要比较的主要功能是性能,易用性,稳定性和灵活性

1
约束力矩产生功能
这个问题源于一问这里大约约束矩生成函数(MGFS)。 假设XXX是一个有界零均值随机变量承担值 [−σ,σ][−σ,σ][-\sigma, \sigma]和让G(t)=E[etX]G(t)=E[etX]G(t) = E[e^{tX}]是其MGF。从结合在Hoeffding不等式的证明使用中,我们有 G(t)=E[etX]≤eσ2t2/2G(t)=E[etX]≤eσ2t2/2G(t) = E[e^{tX}] \leq e^{\sigma^2t^2/2} 其中右侧可识别为标准偏差为σσ\sigma的零均值正常随机变量的MGF 。现在,的标准偏差XXX可以是不大于σσ\sigma,与出现的最大值时XXX是一个离散随机变量,使得 P{X=σ}=P{X=−σ}=12P{X=σ}=P{X=−σ}=12P\{X = \sigma\} = P\{X = -\sigma\} = \frac{1}{2}。因此,所谓的界限可以说是指零均值有界随机变量XXX的MGF高于零均值正常随机变量的MGF,其标准偏差等于XXX可以达到的最大可能标准偏差。有。 我的问题是:这是一个众所周知的独立利益结果,用于霍夫丁不等式的证明以外的其他地方吗?如果是这样,是否还可以用非零均值扩展到随机变量? 的,提示这个问题结果允许不对称范围[a,b][a,b][a,b]为XXX与a&lt;0&lt;ba&lt;0&lt;ba < 0 < b但并坚持E[X]=0E[X]=0E[X] = 0。结合的是 G(t)≤et2(b−a)2/8=et2σ2max/2G(t)≤et2(b−a)2/8=et2σmax2/2G(t) \leq e^{t^2(b-a)^2/8} = e^{t^2\sigma_{max}^2/2} ,其中σmax=(b−a)/2σmax=(b−a)/2\sigma_{\max} = (b-a)/2是值限制为[a,b][a,b][a,b]的随机变量可能的最大标准偏差,但除非b=−ab=−ab = -a否则零均值随机变量不会达到该最大值 。


1
插入符glmnet与cv.glmnet
在glmnet内部caret使用搜索最佳lambda和cv.glmnet执行相同任务的比较中似乎有很多困惑。 提出了许多问题,例如: 分类模型train.glmnet与cv.glmnet? 在插入符号中使用glmnet的正确方法是什么? 使用`caret`交叉验证`glmnet` 但是没有给出答案,这可能是由于问题的可重复性。在第一个问题之后,我给出了一个非常相似的示例,但确实存在相同的问题:为什么估计的lambda如此不同? library(caret) library(glmnet) set.seed(849) training &lt;- twoClassSim(50, linearVars = 2) set.seed(849) testing &lt;- twoClassSim(500, linearVars = 2) trainX &lt;- training[, -ncol(training)] testX &lt;- testing[, -ncol(testing)] trainY &lt;- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = 0.001),standardize=FALSE) …

1
GAM vs LOESS vs花键
语境:我想提请在不出现参数散点图一条线,所以我使用geom_smooth()的ggplot中R。它会自动返回geom_smooth: method="auto" and size of largest group is &gt;=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.我收集的GAM代表广义加性模型,并使用三次样条曲线。 以下看法正确吗? 黄土以特定值估算响应。 样条曲线是连接适合数据的不同分段函数(构成广义加性模型)的近似值,三次样条曲线是此处使用的特定样条曲线类型。 最后,何时应使用花键,何时应使用LOESS?

2
Logistic回归预测的输出
我使用以下代码创建了Logistic回归: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) 然后,我使用输出来创建最终模型: final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg + AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 + Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 + IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg + OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg) 然后,我使用了预测函数预测了不同数据集的结果: log.pred.f.v &lt;- …

2
一堆正态分布的随机变量中最大的是哪个?
我有随机变量。 具有正态分布,均值且方差。的 RVS通常与平均分布和方差。一切都是相互独立的。X0,X1,…,XnX0,X1,…,XnX_0,X_1,\dots,X_nX0X0X_0μ&gt;0μ&gt;0\mu>0111X1,…,XnX1,…,XnX_1,\dots,X_n000111 令表示是其中最大的事件,即。我想计算或估计\ Pr [E]。我正在寻找\ Pr [E]的表达式,作为\ mu,n的函数,或者是\ Pr [E]的合理估计或近似值。EEEX0X0X_0X0&gt;max(X1,…,Xn)X0&gt;max(X1,…,Xn)X_0 > \max(X_1,\dots,X_n)Pr[E]Pr[E]\Pr[E]Pr[E]Pr[E]\Pr[E]μ,nμ,n\mu,nPr[E]Pr[E]\Pr[E] 在我的应用程序中,nnn是固定的(n=61n=61n=61),我想找到使\ Pr [E] \ ge 0.99的\ mu的最小值,但我也对一般问题感到好奇。μμ\muPr[E]≥0.99Pr[E]≥0.99\Pr[E] \ge 0.99

3
中心极限定理与大数定律
中心极限定理指出,随着趋于无穷大,iid变量的均值变得正态分布。NNN 这提出了两个问题: 我们可以由此推论出大数定律吗?如果大数定律告诉我们,随机变量的值的样本均值等于真实平均作为趋于无穷大,那么似乎更强地说,(作为中心极限表示),该值变为其中是标准偏差。那么说中心极限意味着大数定律是否公平?Ñ Ñ(μ ,σ )σμμ\muNNNN(μ,σ)N(μ,σ)\mathcal N(\mu, \sigma)σσ\sigma 中心极限定理是否适用于变量的线性组合?

3
如何计算与异常大的Z分数相关的概率?
用于网络主题检测的软件包可以返回非常高的Z分数(我见过的最高Z分数是600,000+,但是Z分数超过100的情况非常普遍)。我打算证明这些Z分数是伪造的。 巨大的Z得分对应于极低的关联概率。相关概率的值在正态分布的Wikipedia页面(以及可能的每个统计资料教科书)上给出,Z分数最高为6。所以... 问题:如何计算n到1,000,000之间的误差函数?1−erf(n/2–√)1−erf(n/2)1-\mathrm{erf}(n/\sqrt{2}) 我特别希望已经实施了此软件包(如果可能)。到目前为止,我发现的最好的是WolframAlpha,它设法以n = 150(此处)进行计算。


3
炸弹在哪里:给定行和列的总数,如何估计概率?
这个问题的灵感来自《口袋妖怪魂银》的迷你游戏: 想象一下,在这个5x6区域隐藏了15枚炸弹(编辑:最多1枚炸弹/细胞): 现在,考虑到行/列的总数,您如何估计在特定区域找到炸弹的概率? 如果查看第5列(炸弹总数= 5),那么您可能会认为:在此列中,在第2行中找到炸弹的机会是在第1行中找到一个炸弹的机会的两倍。 直接比例性的这种(错误)假设基本上可以描述为将标准独立性测试操作(例如在Chi-Square中)引入错误的上下文中,将导致以下估计: 如您所见,直接成比例导致概率估计超过100%,甚至在此之前是错误的。 因此,我对所有可能的排列进行了计算仿真,得出了放置15枚炸弹的276种独特可能性。(给出行和列的总数) 以下是276个解决方案的平均值: 这是正确的解决方案,但是由于需要进行指数计算,因此我想找到一种估算方法。 我的问题现在是:是否有一种确定的统计方法来对此进行估算?我想知道这是否是一个已知问题,如何称呼它,以及是否有您可以推荐的论文/网站!

2
两个相关多元正态随机变量的线性组合
假设我们有两个随机变量向量,它们都是正常的,即和。我们对它们的线性组合的分布感兴趣,其中和是矩阵,是向量。如果和独立,则。问题是在从属情况下,假设我们知道任何一对的相关性。谢谢。X∼N(μX,ΣX)X∼N(μX,ΣX)X \sim N(\mu_X, \Sigma_X)Y∼N(μY,ΣY)Y∼N(μY,ΣY)Y \sim N(\mu_Y, \Sigma_Y)Z=AX+BY+CZ=AX+BY+CZ = A X + B Y + CAAABBBCCCXXXYYYZ∼N(AμX+BμY+C,AΣXAT+BΣYBT)Z∼N(AμX+BμY+C,AΣXAT+BΣYBT)Z \sim N(A \mu_X + B \mu_Y + C, A \Sigma_X A^T + B \Sigma_Y B^T)(Xi,Yi)(Xi,Yi)(X_i, Y_i) 最好的祝福,伊万

3
如何得出AUC的概率解释?
为什么ROC曲线下的面积使分类器(从检索到的预测中)对随机选择的“正”实例进行排序的概率高于(从原始正分类中)随机选择的“正”实例的概率?如何用积分从数学上证明这一说法,使CDF和PDF具有真实的正负类分布?
14 probability  roc  auc 



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.