Questions tagged «parameterization»

7
贝叶斯会承认有一个固定的参数值吗?
在贝叶斯数据分析中,参数被视为随机变量。这源于贝叶斯概率的主观概念化。但是,贝叶斯理论上是否承认“现实世界”中存在一个真正的固定参数值? 似乎最明显的答案是“是”,因为然后尝试估计参数几乎是荒谬的。对此答案的学术引用将不胜感激。

1
BUGS和R中的参数化对于哪些分布不同?
我发现一些BUGS和R具有不同参数化的分布:正态,对数正态和Weibull。 对于这些中的每一个,我都收集到R所使用的第二个参数需要在BUGS(在我的情况下为JAGS)中使用之前需要进行逆变换(1 /参数)。 有人知道当前存在的这些转换的完整列表吗? 我能找到的最接近的结果是将JAGS 2.2.0用户手册的表7中的分布与etc的结果?rnorm以及一些概率文本进行比较。这种方法似乎需要分别从pdf推导转换。 如果执行此任务,我希望避免执行此任务(以及可能的错误),否则,请从此处开始列表。 更新资料 基于Ben的建议,我编写了以下函数,将参数的数据帧从R转换为BUGS参数化。 ##' convert R parameterizations to BUGS paramaterizations ##' ##' R and BUGS have different parameterizations for some distributions. ##' This function transforms the distributions from R defaults to BUGS ##' defaults. BUGS is an implementation of the BUGS language, and these …

5
名称中的内容:超参数
因此,在正态分布中,我们有两个参数:均值和方差。在《模式识别与机器学习》一书中,突然出现了误差函数的正则化项中的超参数。μμ\muσ2σ2\sigma^2λλ\lambda 什么是超参数?为什么这样命名?它们在直观上与一般参数有何不同?

2
交叉验证和参数优化
使用10倍交叉验证时,我对参数优化存在疑问。 我想问一下,在每次折叠的模型训练过程中参数是否应该固定,即(1)为每个折叠的平均精度选择一组优化的参数。 要么 (2)我应该为每个折页找到优化参数,然后每个折页使用不同的优化参数来训练其模型,然后分别对折页的测试数据进行测试,最后平均每个折页的准确性作为结果? 交叉验证的正确方法是哪一种?非常感谢。

2
随机森林:如果我知道变量很重要怎么办
我的理解是随机森林随机选择mtry变量来构建每个决策树。因此,如果mtry = ncol / 3,则每个变量平均将在1/3的树中使用。而2/3的树木将不会使用它们。 但是,如果我知道单个变量可能非常重要,那么手动增加在每棵树中选择此变量的可能性会很好吗?R中的randomForest包可行吗?

2
超参数化模型的Fisher信息矩阵行列式
考虑一个带有参数(成功概率)的伯努利随机变量。似然函数和Fisher信息(矩阵)为:X∈{0,1}X∈{0,1}X\in\{0,1\}θθ\theta1×11×11 \times 1 L1(θ;X)I1(θ)=p(X|θ)=θX(1−θ)1−X=detI1(θ)=1θ(1−θ)L1(θ;X)=p(X|θ)=θX(1−θ)1−XI1(θ)=detI1(θ)=1θ(1−θ) \begin{align} \mathcal{L}_1(\theta;X) &= p(\left.X\right|\theta) = \theta^{X}(1-\theta)^{1-X} \\ \mathcal{I}_1(\theta) &= \det \mathcal{I}_1(\theta) = \frac{1}{\theta(1-\theta)} \end{align} 现在考虑带有两个参数的“过度参数化”版本:成功概率θ1θ1\theta_1和失败概率θ0θ0\theta_0。(请注意θ1+θ0=1θ1+θ0=1\theta_1+\theta_0=1,并且此约束表示参数之一是多余的。)在这种情况下,似然函数和Fisher信息矩阵(FIM)为: L2(θ1,θ0;X)I2(θ1,θ0)detI2(θ)=p(X|θ1,θ0)=θX1θ1−X0=(1θ1001θ0)=1θ1θ0=1θ1(1−θ1)L2(θ1,θ0;X)=p(X|θ1,θ0)=θ1Xθ01−XI2(θ1,θ0)=(1θ1001θ0)detI2(θ)=1θ1θ0=1θ1(1−θ1) \begin{align} \mathcal{L}_2(\theta_1,\theta_0;X) &= p(\left.X\right|\theta_1,\theta_0) = \theta_1^{X}\theta_0^{1-X} \\ \mathcal{I}_2(\theta_1,\theta_0) &= \left( \begin{matrix} \frac{1}{\theta_1} & 0 \\ 0 & \frac{1}{\theta_0} \end{matrix} \right) \\ \det \mathcal{I}_2(\theta) &= \frac{1}{\theta_1 \theta_0} = \frac{1}{\theta_1 (1-\theta_1)} \end{align} …

1
参数化Behrens-Fisher分布
Seock-Ho Kim和艾伦·科恩(Allen S. Cohen)撰写的“关于贝伦斯-费舍尔问题:评论” 教育与行为统计杂志,第23卷,第4期,1998年冬季,第356-377页 我正在看这个东西,它说: Fisher(1935,1939)选择统计量 [其中是通常的单样本统计量],其中位于第一象限中,而 [。。。]的分布是Behrens-Fisher分布,由三个参数,和,τ=δ−(x¯2−x¯1)s21/n1+s22/n2−−−−−−−−−−−√=t2cosθ−t1sinθτ=δ−(x¯2−x¯1)s12/n1+s22/n2=t2cos⁡θ−t1sin⁡θ \tau = \frac{\delta-(\bar x_2 - \bar x_1)}{\sqrt{s_1^2/n_1+s_2^2/n_2}} = t_2\cos\theta - t_1\sin\theta titit_ittti=1,2i=1,2i=1,2θθ\thetatanθ=s1/n1−−√s2/n2−−√.(13)(13)tan⁡θ=s1/n1s2/n2. \tan\theta = \frac{s_1/\sqrt{n_1}}{s_2/\sqrt{n_2}}.\tag{13} ττ\tauν1ν1\nu_1ν2ν2\nu_2θθ\theta 对于,参数先前已定义为。νiνi\nu_ini−1ni−1n_i-1i=1,2i=1,2i=1,2 现在,这里看不到的是,这两个总体的平均值是,,它们的差是,因此是和两个统计量。样本SD和是可观察的,并用于定义,因此是可观察的统计信息,而不是不可观察的总体参数。但是我们看到它被用作这个分布族的参数之一!δδ\deltaμ1μ1\mu_1μ2μ2\mu_2δδ\deltaττ\tauttts1s1s_1s2s2s_2θθ\thetaθθ\theta 可能是他们应该说参数是的反正切值,而不是的反正切值?σ1/n1−−√σ2/n2−−√σ1/n1σ2/n2\dfrac{\sigma_1/\sqrt{n_1}}{\sigma_2/\sqrt{n_2}}s1/n1−−√s2/n2−−√s1/n1s2/n2\dfrac{s_1/\sqrt{n_1}}{s_2/\sqrt{n_2}}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.