Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

9
这张图表显示恐怖袭击的可能性在统计上有用吗?
我看到这张图片传了很多。 我有种直觉,认为以这种方式提供的信息是不完整的,甚至是错误的,但是我对统计数据并不足够了解。这让我想到了这本xkcd漫画,即使有了可靠的历史数据,某些情况也可以改变事情的预测方式。 所提供的这张图表对准确显示难民的威胁水平有用吗?是否有必要的统计背景或多或少地使此图表有用? 注意:请尝试使用外行人的术语:)

7
多少钱?实际问题
这不是家庭作业的问题,而是我们公司面临的实际问题。 最近(两天前),我们向经销商订购了10000个产品标签的制造。经销商是独立的人。他获得了从外部制造的标签,公司付款给经销商。每个标签对公司的成本为1美元。 昨天,经销商附带了标签,但标签捆绑在一起,每包100个标签。这样总共有100个数据包,每个数据包包含100个标签,因此总共有10000个标签。在向经销商支付10000美元之前,我们决定不计几包,以确保每个包中都准确地包含100个标签。当我们计算标签时,我们发现数据包不足100个标签(我们找到了97个标签)。为了确保这不是偶然的,而是有意进行的,我们再计算了5个数据包,并在每个数据包(包括第一个数据包)中找到了以下标签数: Packet Number Number of labels 1 97 2 98 3 96 4 100 5 95 6 97 无法计算每个小包,因此我们决定平均付款。因此,六个封包中的标签平均数量为97.166,因此总付款额为9716美元。 我只想知道统计学家必须如何处理这类问题。 此外,我想知道我们应该支付多少钱才能获得95%的保证,即我们支付的总标签数量不超过实际数量。 附加信息: P(任何大于100个标签的数据包)= 0 P(任何小于90个标签的数据包)= 0 =标签数小于90时很容易检测到小于90个标签,因为数据包的重量更小} 编辑: 经销商只是否认了这种渎职行为。我们发现这些经销商是在特定的佣金下工作的,他们从制造商那里得到公司的付款。当我们直接与制造商联系时,我们发现这既不是制造商也不是经销商的错。制造商说:“标签之所以短缺,是因为纸张的尺寸没有标准化,并且从单张纸上切下的任何数量都将它们捆成一包。” 此外,我们验证了附加信息中给出的第一个断言,因为制造商承认,由于纸张尺寸的小幅增加,因此无法裁切额外的标签,而且由于纸张尺寸的小幅缩小,因此无法裁切100个大小完全相同的标签。

7
为什么要优化最大对数概率而不是概率
在大多数机器学习任务中,您可以制定应最大化的概率,我们实际上将优化对数概率而不是某些参数的概率。例如,在最大似然训练中,通常是对数似然。使用某些渐变方法进行此操作时,涉及一个因素:数p θppp日志plog⁡p\log pθθ\theta ∂日志p∂θ= 1p·&∂&p∂θ∂log⁡p∂θ=1p⋅∂p∂θ \frac{\partial \log p}{\partial \theta} = \frac{1}{p} \cdot \frac{\partial p}{\partial \theta} 有关示例,请参见此处或此处。 当然,优化是等效的,但梯度会有所不同,因此任何基于梯度的方法的行为都会有所不同(尤其是随机梯度方法)。是否有理由证明梯度比梯度更好?p日志plog⁡p\log pppp

11
脑筋急转弯:如何使用具有pr(head)= p的偏向硬币以相等的概率生成7个整数?
这是我在Glassdoor上发现的一个问题:如何使用具有的硬币以相等的概率生成7个整数Pr(Head)=p∈(0,1)Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1)? 基本上,您有一个硬币,可能是公平的,也可能是不公平的,这是唯一的随机数生成过程,因此想出一个随机数生成器,它输出从1到7的整数,其中获得每个整数的概率是1/7。 数据生成过程的效率至关重要。

13
连续10个头是否增加了下一次折腾成为尾巴的机会?
我假设以下情况是正确的:假设硬币是公平的,则抛硬币时连续获得10个正面,这并不会增加下一个抛硬币成为尾巴的机会,无论周围扔了多少概率和/或统计术语(打扰) 假设情况是这样,我的问题是:我该如何说服某人呢? 他们很聪明,受过良好教育,但似乎决心不考虑我在这个问题上的正确性。


4
如何生成相关的随机数(给定的均值,方差和相关度)?
很抱歉,这似乎太基本了,但是我想我只是想在这里确认了解。我觉得我必须分两步执行此操作,并且我已经开始尝试绘制相关矩阵,但是它似乎才真正开始涉及。我正在寻找一种简洁,合理的解释(理想情况下带有对伪代码解决方案的提示),这是一种生成相关随机数的理想方法。 给定两个具有已知均值和方差的伪随机变量height和weight以及给定的相关性,我认为我基本上是在试图理解第二步应该是什么样子: height = gaussianPdf(height.mean, height.variance) weight = gaussianPdf(correlated_mean(height.mean, correlation_coefficient), correlated_variance(height.variance, correlation_coefficient)) 如何计算相关的均值和方差?但是我想确认这确实是相关的问题。 我需要诉诸矩阵操纵吗?还是我在解决此问题的基本方法上还有其他非常错误的地方?

14
高斯(正态)分布最令人惊讶的特征是什么?
可以通过明确给出其密度来定义上的标准化高斯分布: RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} 或其特征功能。 就像在这个问题中提到的那样,它也是样本均值和方差是独立的唯一分布。 您知道高斯测量的其他令人惊讶的替代特征是什么?我会接受最令人惊讶的答案


3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

15
预期出生女孩与出生男孩的比例
我在求职面试能力测验中遇到了一个批判性思考的问题。它是这样的: Zorganian Republic有一些非常奇怪的习俗。夫妻只希望生女,因为只有女才能继承家庭的财产,因此,如果有男生,他们将继续生更多的孩子,直到有了女孩。如果他们有一个女孩,他们就不再有孩子。在Zorgania,男女比例是多少? 我不同意问题作者给出的模型答案,该答案大约为1:1。有道理的是,任何出生都会有50%的机会成为男性或女性。 如果是该国的女孩人数,B是该国的男孩人数,您能否用数学上更强的答案说服我?GE [ G ] :E [ B ]E[G]:E[B]\text{E}[G]:\text{E}[B]GGG

6
分布之间的Kolmogorov距离的动机
有许多方法可以测量两个概率分布的相似程度。在不同的圈子中流行的方法有: Kolmogorov距离:分布函数之间的超距离; 坎托罗维奇-鲁宾斯坦距离:两个具有Lipschitz常数的函数的期望值之间的最大差,也就是分布函数之间的L 1距离;1个1个1大号1个大号1个L^1 bounded-Lipschitz距离:与KR距离一样,但函数也必须具有最大绝对值。1个1个1 这些有不同的优点和缺点。实际上,只有3.意义上的收敛才真正对应于分布的收敛。一般而言,在1.或2.的意义上的收敛性要强一些。(特别是如果的概率为1,则Xn的分布收敛为0,但不在Kolmogorov距离内收敛。但是,如果极限分布是连续的,则不会发生这种病理情况。)Xñ= 1ñXñ=1个ñX_n=\frac{1}{n}1个1个1XñXñX_n000 从基本概率或测度理论的角度来看,1.很自然,因为它比较了某个集合中的概率。另一方面,更复杂的概率视角倾向于更多地关注期望而不是概率。同样,从功能分析的角度来看,基于二元性和某些功能空间的距离(如2.或3.)非常吸引人,因为有大量的数学工具可用于处理此类事物。 但是,我的印象(如果我错了,请纠正我!)是在统计中,Kolmogorov距离是衡量分布相似度的通常首选方法。我可以猜出一个原因:如果其中一个分布是在有限支持下离散的,特别是如果它是一些实际数据的分布,那么到模型分布的Kolmogorov距离就很容易计算。(实际上,KR距离的计算较难,BL距离实际上是不可能的。) 因此,我的问题(最后)是,出于统计目的,是否还有其他原因(无论是实践原因还是理论原因)都倾向于使用Kolmogorov距离(或其他距离)?


3
CDF是否比PDF更基础?
我的统计专家基本上说过,如果给出以下三个之一,则可以找到其他两个: 累积分布函数 瞬间产生功能 概率密度函数 但是我的计量经济学教授说,CDF比PDF更基础,因为在某些示例中您可以拥有CDF,但未定义PDF。 CDF是否比PDF更基础?我如何知道可以从CDF导出PDF还是MGF?
43 probability  pdf  cdf  mgf 

7
您必须多久滚动一次6面骰子才能获得每个数字至少一次?
我刚刚和我的孩子们一起玩过一个游戏,基本上可以归结为:谁在6面骰子获胜中至少掷出每个数字一次。 最终我赢了,其他人则在1-2回合后完成。现在我想知道:对游戏时间的期望是什么? 我知道直到您击中特定数字之前的数预期为 。∑∞n = 1n 16(56)n − 1= 6∑n=1∞n16(56)n−1=6\sum_{n=1}^\infty n\frac{1}{6}(\frac{5}{6})^{n-1}=6 但是,我有两个问题: 您必须滚动六面骰子多少次才能获得至少每个数字一次? 在四次独立测试(即有四个玩家)中,对最大掷骰数的期望是什么?[注意:这是最大的,而不是最小的,因为在他们的年龄,这更关乎完成而不是让我的孩子们先到达那里] 我可以模拟结果,但是我不知道如何进行分析计算。 这是Matlab中的Monte Carlo模拟 mx=zeros(1000000,1); for i=1:1000000, %# assume it's never going to take us >100 rolls r=randi(6,100,1); %# since R2013a, unique returns the first occurrence %# for earlier versions, take the minimum of x %# and …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.