Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

4
并联电阻的变化
假设您有一组电阻R,所有电阻均以均值μ和方差σ分布。 考虑具有以下布局的电路的一部分:(r)|| (r + r)|| (r + r + r)。每个部分的等效电阻分别为r,2r和3r。然后每个部分的方差是σ2σ2σ^2,2σ22σ22σ^2,3σ23σ23σ^2。 整个电路的电阻变化是多少? 在对数百万个点进行采样之后,我们发现方差约为.10286σ2.10286σ2.10286\sigma^2。 我们将如何分析得出这个结论? 编辑:假设电阻值是正态分布的,具有一些平均电阻r和方差σ2σ2σ^2。

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
证明序列减少(通过绘制大量点来支持)
上个月我在SE上发布的许多问题都是为了帮助我解决这一特定问题。问题均已回答,但我仍然无法提出解决方案。因此,我认为我应该直接问我要解决的问题。 让 Xn∼FnXn∼FnX_n \sim F_n,在哪里 Fn= (1 − (1 −Fn − 1)C)CFn=(1−(1−Fn−1)c)cF_n = (1-(1-F_{n-1})^c)^c, F0= xF0=xF_0 = x, Ç ≥ 2c≥2c\geq 2 (整数),以及每个 FñFnF_n 超过CDF (0 ,1 )(0,1)(0,1)。 我想证明 EXnEXn\mathbb{E}X_n 减少 nnn 对所有人 ccc (甚至对于任何特定 ccc)!我可以证明FnFnF_n 以独特的解收敛到狄拉克质量 xc=(1−(1−x)c)c)xc=(1−(1−x)c)c)x_c = (1-(1-x)^c)^c) 对于 c=2c=2c=2, x2=(3−5–√)/2≈.38x2=(3−5)/2≈.38x_2 = (3-\sqrt{5})/2 \approx .38。当看CDFS增加时nnn都是一样的 ccc,所有cdf交叉在 xnxnx_n。的价值F(x)F(x)F(x) 减少值 …

13
如果“ B更有可能给定A”,那么“ A更有可能给定B”
我试图获得更清晰的直觉:“如果使更有可能,那么使更有可能”一个AA乙BB乙BB一个AA 令表示和所在的空间的大小,然后Ñ (小号)n(S)n(S)一个AA乙BB 要求:使得P(B|A)>P(B)P(B|A)>P(B)P(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A) > n(B)/n(S) 所以n(AB)/n(B)>n(A)/n(S)n(AB)/n(B)>n(A)/n(S)n(AB)/n(B) > n(A)/n(S) 这是P(A|B)>P(一)P(A|B)>P(A)P(A|B)>P(A) 我理解数学,但是为什么这很直观?

1
检查硬币是否公平
一位朋友问我以下问题。我不能帮她,但我希望有人可以向我解释。我找不到类似的示例。感谢您的帮助和解释。 问:100次抛硬币实验的结果记录为0 =“ Tail”和1 =“ Head”。输出x是0的字符串,长度为100的1。计算x中得到1-0-0的次数,它是20(例如:如果x =(001001110100),1-0-0发生2次)。您认为这是一个公平的硬币吗?

5
为什么连续均匀分布中的概率之和不是无穷大?
上面显示了均匀分布(连续)的概率密度函数。曲线下的面积为1-这很有意义,因为概率分布中所有概率的总和为1。 形式上,上述概率函数(f(x))可以定义为 [a,b]中x的1 /(ba) 否则为0 考虑到我必须在a(例如2)和b(例如6)之间选择一个实数。这使均匀概率= 0.25。但是,由于在该间隔中存在无限数量的数字,所有概率之和是否不应该等于无穷大?我在俯视什么? f(x)不是x出现的概率吗?

1
0删减的多元法线的均值和方差是多少?
设在。的均值和协方差矩阵是什么(最大逐元素计算)?Z∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma)RdRd\mathbb R^dZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z) 例如,这是因为,如果我们在深层网络中使用ReLU激活功能,并通过CLT假定给定层的输入近似正常,则这就是输出的分布。 (我确信很多人以前都已经计算过了,但是我找不到以合理可读的方式列出的结果。)

3
更高的是或
因此,我进行了概率测试,但我无法真正回答这个问题。它只是问这样的事情: “考虑到是一个随机变量 0,请使用正确的不等式证明E(X ^ 2)^ 3或E(X ^ 3)^ 2等于或更高。XXXXXX ⩾⩾\geqslant 000E(X2)3E(X2)3E(X^2)^3E(X3)2E(X3)2E(X^3)^2 我唯一能想到的就是詹森的不平等,但我真的不知道如何在这里应用它。

2
独立平方均匀随机变量之和的平方根的期望
让X1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)是独立的,identicallly分布式标准统一的随机变量。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_n的期望很容易: E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 现在是无聊的部分。要申请LOTUS,我需要YnYnY_n的pdf 。当然,两个独立随机变量之和的pdf是其pdf的卷积。但是,这里我们有nnn随机变量,我猜想卷积会导致一个...卷积的表达式(意想不到的双关语)。有没有更聪明的方法? 我希望看到正确的解决方案,但如果不可能或过于复杂,则可以接受大nnn的渐近近似。根据詹森的不等式,我知道 E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] 但这对我没有多大帮助,除非我还能找到一个不平凡的下限。请注意,CLT不适用于此处,因为我们拥有独立RV的总和的平方根,而不仅仅是独立RV的总和。也许可能存在其他极限定理(我忽略了),在这里可能会有帮助。


2
如果我希望有95%的机会出现少于1%的对象有故障,我需要多少个样本?
我需要确保我的XML网站地图的垃圾少于(链接断开)。URL的列表是成百上千的,即使出于所有原因我也可能不愿意一一测试所有URL,但我还是不愿意这样做:1%1%1\% 1 - Saved bandwidth 2 - Faster traffic for real clients 3 - Less noise in visitor statistics (because my test would count as a visit) 5 - I could go on... 所以我认为随机取一个子集就足够了,问题是我不知道概率。 我可以使用一个简单的功能吗? 如果有帮助的话,我们可以假设有一个先验信息,可了解链路在运行过程中断裂的可能性。假设在每次运行中,给定链接的断开为。0.75%0.75%0.75\%

1
我们可以从得出结论,是独立的吗?
好吧,我们无法看到 有趣的反例,例如https://en.wikipedia.org/wiki/Subindependence。但是真正的问题是:是否有某种方法可以加强这种状况,从而使独立性得以遵循?例如,有一些组的功能使得如果对于所有然后独立如下?而且,这样的函数集必须有多大?E g i(X )g j(Y )= E g i(X )E g j(Y )i ,jG1个,… ,gñg1,…,gng_1, \dotsc, g_nËG一世(X)克Ĵ(是)= EG一世(X)EGĴ(是)E⁡gi(X)gj(Y)=E⁡gi(X)E⁡gj(Y)\E g_i(X) g_j(Y) =\E g_i(X) \E g_j(Y)我,Ĵi,ji,j 而且,还有一些很好的参考资料可以解决这个问题吗?

2
非随机伯努利变量的这个随机和的概率分布是多少?
我试图找到随机分布的变量总数之和的概率分布。这是一个例子: 约翰在客户服务呼叫中心工作。他接到有问题的电话,并设法解决问题。他无法解决的问题,他将其转发给上级。假设他一天接到的电话数量遵循Poisson分布,平均值为。每个问题的难度从非常简单的东西(他绝对可以解决)到非常专业的问题(他都不知道如何解决)不等。假设他将能够解决第i个问题的概率p i遵循具有参数α和β的Beta分布,并且与先前的问题无关。他一天解决的电话数量分布如何?μμ\mup一世pip_iαα\alphaββ\beta 更正式地说,我有: 为我= 0 ,1 ,2 ,。。。,Nÿ= 我(N> 0 )∑ñ我= 0X一世Y=I(N>0)∑i=0NXiY = I(N > 0)\sum_{i = 0}^{N} X_i我= 0 ,1 ,2 ,。。。,Ni=0,1,2,...,Ni = 0, 1, 2, ..., N 其中,(X 我| p 我)〜乙Ë ř Ñ Ò ù 升升我(p 我)和p 我〜乙Ë 吨一个(α ,β )ñ〜P ø 我小号小号ø Ñ(μ )N∼Poisson(μ)N \sim \mathrm{Poisson}(\mu)(X一世| …

1
哪种深度学习模型可以对不互斥的类别进行分类
示例:我的职位描述中有一句话:“英国Java高级工程师”。 我想使用深度学习模型将其预测为2类:English 和IT jobs。如果我使用传统的分类模型,则只能预测softmax最后一层具有功能的标签。因此,我可以使用2个模型神经网络来预测两个类别的“是” /“否”,但是如果我们有更多类别,那就太贵了。那么,我们是否有任何深度学习或机器学习模型可以同时预测2个或更多类别? “编辑”:使用传统方法使用3个标签,它将由[1,0,0]编码,但在我的情况下,它将由[1,1,0]或[1,1,1]编码 示例:如果我们有3个标签,并且所有这些标签都适合一个句子。因此,如果softmax函数的输出为[0.45,0.35,0.2],我们应该将其分类为3个标签或2个标签,或者可以是一个?我们这样做的主要问题是:分类为1个,2个或3个标签的最佳阈值是多少?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Markov,Chebyshev不等式严密的随机变量
我对构造Markov或Chebyshev不等式严密的随机变量感兴趣。 一个简单的示例是以下随机变量。 。其均值为0,方差为1,并且 P (| X | ≥ 1 )= 1。对于这个随机变量,chebyshev是紧的(保持相等)。P(X= 1 )=P(X=−1)=0.5P(X=1)=P(X=−1)=0.5P(X=1)=P(X=-1) = 0.5P(|X|≥1)=1P(|X|≥1)=1P(|X| \ge 1) = 1 P(|X|≥1)≤Var(X)12=1P(|X|≥1)≤Var(X)12=1P(|X|\ge 1) \le \frac{\text{Var}(X)}{1^2} = 1 是否存在马尔可夫和切比雪夫紧的其他有趣(非均匀)随机变量?一些例子将是很好的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.