Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

3
您如何判断良好的表现是否连胜?
我将Rubik的多维数据集作为爱好解决。我记录了使用某些软件解决多维数据集所花费的时间,因此现在我有了来自数千个解决方案的数据。数据基本上是一长串数字,代表每个顺序求解所花费的时间(例如22.11、20.66、21.00、18.74等) 自然,我求解多维数据集所需的时间因求解的不同而有所不同,因此有好的求解和不好的求解。 我想知道我是否“变热”-好的解决方案是否会出现条纹。例如,如果我连续有几个好的解决方案,那么下一个解决方案是否更有可能变得更好? 哪种分析比较合适?我可以想到一些具体的事情,例如将解决方案视为马尔可夫过程,查看一个解决方案对下一个解决方案的预测程度,并与随机数据进行比较,查看连续解决方案的最长条纹在最后一个解决方案中位数以下的时间100并与随机数据等中的预期值进行比较。我不确定这些测试的洞察力如何,并想知道是否存在一些针对此类问题的完善方法。

4
核事故的综合概率
日本最近发生的事件使我思考以下问题。 通常,核电厂的设计目的是将严重事故的风险限制在“设计基准概率”之内,例如10E-6 /年。这是单个工厂的标准。但是,当有数百个反应堆时,我们该如何结合发生严重事故的单个概率?我知道自己可能会对此进行研究,但是找到该站点后,我确信可以有人很容易回答这个问题。谢谢

4
如何估算R中零膨胀参数的密度?
我有一个很多零的数据集,看起来像这样: set.seed(1) x <- c(rlnorm(100),rep(0,50)) hist(x,probability=TRUE,breaks = 25) 我想为其密度画一条线,但是该density()函数使用一个移动窗口来计算x的负值。 lines(density(x), col = 'grey') 有一个density(... from, to)参数,但是这些参数似乎只会截断计算,而不会更改窗口,因此0处的密度与数据一致,如以下图所示: lines(density(x, from = 0), col = 'black') (如果插值被更改,我希望黑线在0处的密度比灰线高) 此功能是否有替代方法可以更好地计算零密度?
10 r  probability  kde 

1
高斯过程/狄利克雷过程等随机过程是否具有密度?如果没有,如何对他们应用贝叶斯规则?
Dirichlet Pocess和高斯过程通常被称为“函数分布”或“分布分布”。在那种情况下,我可以有意义地谈谈GP下函数的密度吗?也就是说,高斯过程或Dirichlet过程是否具有概率密度的概念? 如果不是,那么,如果对函数的先验概率的概念没有很好地定义,我们如何使用贝叶斯定律从后验先到?贝叶斯非参数世界中是否存在诸如MAP或EAP估计之类的东西?非常感谢。

3
大型数据集的高斯过程回归
我一直在从在线视频和讲义中学习有关高斯过程回归的知识,我的理解是,如果我们有一个包含个点的数据集,那么我们就假设数据是从维多元高斯模型中采样的。所以我的问题是在是百万分之一的情况下,高斯过程回归仍然有效吗?内核矩阵会不会很大,从而使过程完全无效?如果是这样,是否有适当的技术来处理此问题,例如多次重复从数据集中采样?处理这类案件有哪些好的方法? ññnññnññn

3
如果是有限的,吗?
对于连续随机变量XXX,如果E(|X|)E(|X|)E(|X|)是有限的,则limn→∞nP(|X|&gt;n)=0limn→∞nP(|X|&gt;n)=0\lim_{n\to\infty}n P(|X|>n)=0吗? 这是我在互联网上发现的一个问题,但是我不确定它是否成立。 我知道nP(|X|&gt;n)&lt;E(|X|)nP(|X|&gt;n)&lt;E(|X|)n P(|X|>n)<E(|X|)由Markov不等式成立,但是我无法证明当nnn趋于无穷大时,它变为0 。

2
概率的频繁定义;是否存在正式定义?
关于常客在“概率”下理解的内容,是否有任何正式(数学)定义。我读到这是“从长远来看”的相对发生频率,但是是否有一些正式的方法来定义它?在哪里可以找到该定义的已知参考文献? 编辑: 对于常客(请参阅@whuber的评论以及我对答案@Kodiologist和@Graeme Walsh的评论,下面的答案),我的意思是那些“相信”这种长期相对频率存在的人。也许这(部分)也回答了@Tim的问题

3
将法线除以可得出t分布-证明
让和。w ^ 〜χ 2(小号)Z∼N(0,1)Z∼N(0,1)Z \sim N(0,1)W∼χ2(s)W∼χ2(s)W \sim \chi^2(s) 如果和独立分布,则变量遵循自由度的分布。W Y = ZZZZWWW吨小号Y=ZW/s√Y=ZW/sY = \frac{Z}{\sqrt{W/s}}tttsss 我正在寻找这一事实的证明,如果您不想写下完整的参数,那么引用就足够了。

1
几乎可以肯定,收敛并不意味着完全收敛
如果每个我们说完全收敛到。X1,X2,…X1,X2,…X_1, X_2, \ldotsXXXϵ&gt;0ϵ&gt;0\epsilon>0 ∑∞n=1P(|Xn−X|&gt;ϵ)&lt;∞∑n=1∞P(|Xn−X|&gt;ϵ)&lt;∞\sum_{n=1}^\infty \text{P}\left(|X_n-X|>\epsilon\right) <\infty 有了Borel Cantelli的引理,就可以直接证明完全收敛意味着几乎肯定的收敛。 我正在寻找一个几乎可以确定Borel Cantelli无法证明融合的示例。这是一个随机变量序列,几乎可以肯定收敛,但不能完全收敛。

1
具有的最小方差的无偏估计量
让X1个,。。。,XñX1个,。。。,Xñ X_1, ...,X_n 成为分布的随机样本 ģ Ë ø 米é 吨ř 我Ç (θ )GËØ米ËŤ[R一世C(θ)Geometric(\theta) 对于 0 &lt; θ &lt; 10&lt;θ&lt;1个0<\theta<1。即 pθ(X )= θ (1 - θ)x − 1一世{ 1 ,2 ,。。。}(x )pθ(X)=θ(1个-θ)X-1个一世{1个,2,。。。}(X)p_{\theta}(x)=\theta(1-\theta)^{x-1} I_{\{1,2,...\}}(x) 查找具有最小方差的无偏估计量 G(θ )=1个θG(θ)=1个θg(\theta)=\frac{1}{\theta} 我的尝试: 由于几何分布来自指数族,因此统计 ∑X一世∑X一世\sum X_i 完整且足够 θθ \theta。另外,如果Ť(X)=X1个Ť(X)=X1个T(X)=X_1 是一个估计 G(θ )G(θ)g(\theta),这是公正的。因此,根据Rao-Blackwell定理和Lehmann-Scheffé定理, w ^(X)= E[X1个| ∑X一世]w ^(X)=Ë[X1个|∑X一世]W(X) = …

1
随机变量函数的概率分布?
我有一个疑问:考虑实值随机变量和无论在概率空间定义。XXXZZZ(Ω,F,P)(Ω,F,P)(\Omega, \mathcal{F},\mathbb{P}) 令,其中是实值函数。由于是随机变量的函数,因此它是随机变量。Y:=g(X,Z)Y:=g(X,Z)Y:= g(X,Z)g(⋅)g(⋅)g(\cdot)YYY 令即的实现。x:=X(ω)x:=X(ω)x:=X(\omega)XXX 是等于?P(Y|X=x)=P(g(X,Z)|X=x)P(Y|X=x)=P(g(X,Z)|X=x)\mathbb{P}(Y|X=x)=\mathbb{P}(g(X,Z)|X=x)P(g(x,Z))P(g(x,Z))\mathbb{P}(g(x,Z))

3
来自相同种群的多次采样的交集概率
这是一个示例情况: 我的人口为10,000。每个项目都有一个唯一的ID。 我随机挑选100件物品并记录ID 我把100件物品放回了人口中 我再次随机选择100个项目,记下ID并替换。 总共我重复了5次随机抽样 概率是多少 XXX 5个随机抽样中出现多少个项目? 我不是很精通统计。这是正确的吗X= 10X=10X = 10? 对于每个采样,从10,000起的100个项目的可能组合数为 b 我Ñ ø 米(10000,100)b一世ñØ米(10000,100){\rm binom}(10000, 100) 在100种商品的所有可能组合中, b 我Ñ ø 米(9990,90)* b 我Ñ ø 米(100,10)b一世ñØ米(9990,90)∗b一世ñØ米(100,10){\rm binom}(9990, 90) * {\rm binom}(100, 10) 组合包含10个特定项目 包含10个特定项目的概率为 (b 我Ñ ø 米(9990 ,90 )* b 我Ñ ø 米(100 ,10 ))/ b …

1
替换图纸时的预期重复数(三倍等)
我有以下问题: 我有100个独特的商品(n),我一次选择了43个(m)一件(有替换商品)。 我需要解决唯一性的预期数量(仅选择一次,k = 1),双打(恰好选择两次k = 2),三重(恰好k = 3),四边形等。 我已经找到了很多关于至少有一个双倍(生日悖论)的概率的结果,但是没有关于总体中预期的对数。

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
关于样本自协方差函数的问题
我正在阅读时间序列分析书,样本自协方差的公式在书中定义为: γˆ(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)γ^(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) 与对于。是平均值。γˆ(−h)=γˆ(h)γ^(−h)=γ^(h)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\;h=0,1,...,n−1h=0,1,...,n−1\;h = 0,1, ..., n-1x¯x¯\bar{x} 有人可以直观地解释为什么我们将总和除以而不是吗?这本书解释说,这是因为上面的公式是一个非负的确定函数,因此最好除以,但这对我来说还不清楚。有人可以证明这一点,还是可以举例说明?nnnn−hn−hn-hnnn 对我而言,起初直观的事情就是除以。这是对自协方差的无偏估计吗?n−hn−hn-h

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.