Questions tagged «computational-statistics»

指统计和计算的接口;用于统计目的的算法和软件的使用。


1
有人可以从Hastie的ESL书中解释一下像我5岁这样的问题吗?
我正在阅读Hastie的ESL书,而在问题2.3方面却遇到了困难。问题如下: 我们正在考虑原点处的最近邻居估计,并且由该方程式给出了从原点到最近数据点的中值距离。我不知道从哪里开始尝试得出这一点。 我知道大多数数据点比其他任何数据点(维数的诅咒)都更接近样本空间的边界,但是我很难将其转换为线性代数/概率意义。 谢谢!


3
Mathematica的随机数生成器是否偏离二项式概率?
因此,假设您掷硬币10次,并将其称为1个“事件”。如果您运行这些事件中的1,000,000,那么正面在0.4到0.6之间的事件所占的比例是多少?二项式概率表明这大约为0.65,但是我的Mathematica代码告诉我大约为0.24 这是我的语法: In[2]:= X:= RandomInteger[]; In[3]:= experiment[n_]:= Apply[Plus, Table[X, {n}]]/n; In[4]:= trialheadcount[n_]:= .4 < Apply[Plus, Table[X, {n}]]/n < .6 In[5]:= sample=Table[trialheadcount[10], {1000000}] In[6]:= Count[sample2,True]; Out[6]:= 245682 灾难在哪里?

2
如何在助推树中找到调整参数的最佳值?
我意识到在Boosting Trees模型中有3个调整参数,即 树数(迭代数) 收缩参数 分割数(每个构成树的大小) 我的问题是:对于每个调整参数,我应该如何找到其最佳值?什么方法? 请注意:收缩参数和树木数量参数一起使用,即收缩参数的值越小,树木数量的值就越高。我们也需要考虑到这一点。 我对为分割数找到最佳值的方法特别感兴趣。是否应该基于交叉验证或有关背后模型的领域知识? 这些事情如何gbm在R 的包中进行?

1
如何从先验和似然计算后验密度估计?
我试图了解如何使用贝叶斯定理来计算后验,但被计算方法所困扰,例如,在以下情况下,我不清楚如何获取先验和似然的乘积,然后计算出后: 对于此示例,我有兴趣计算的后验概率,并且在上使用标准正态先验,但是我想知道如何通过MCMC链表示的上的先验计算后验,因此我将使用1000个样本作为起点。μμ\muμμ\mu p (μ )〜Ñ(μ = 0 ,σ= 1 )p(μ)∼N(μ=0,σ=1)p(\mu)\sim N(\mu = 0, \sigma = 1)μμ\mu 从先前的样本1000。 set.seed(0) prior.mu <- 0 prior.sigma <- 1 prior.samples <- sort(rnorm(1000, prior.mu, prior.sigma)) 做一些观察: observations <- c(0.4, 0.5, 0.8, 0.1) 并计算可能性,例如:p (ÿ| μ,σ)p(y|μ,σ)p(y | \mu, \sigma) likelihood <- prod(dnorm(observations, mean(prior.samplse), sd(prior.samples))) 我不太了解的是: 什么时候/如何将先验乘以可能性? 什么时候/如何规范后验密度? …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.