Questions tagged «graphical-model»

也称为概率图形模型,用于通过图表示的统计模型(是否为因果关系)。(Nb,按图论中的“图”表示,*不按图或图中的*表示)。

3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


2
解释残差与拟合值的关系图,以验证线性模型的假设
考虑下Faraway的带有R的线性模型的图形(2005年,第59页)。 第一个图似乎表明残差和拟合值不相关,因为它们应该在具有正态分布误差的均线线性模型中。因此,第二和第三幅图似乎表明了残差和拟合值之间的相关性,提出了不同的模型。 但是,正如Faraway所述,为什么第二个图建议一个异方差线性模型,而第三个图建议一个非线性模型呢? 第二个图似乎表明残差的绝对值与拟合值强烈正相关,而在第三个图中没有明显的趋势。因此,从理论上讲,如果存在具有正态分布误差的异方差线性模型, 肺心病(ē,y^)=⎡⎣⎢⎢1个⋮1个⋯⋱⋯1个⋮1个⎤⎦⎥⎥肺心病(Ë,ÿ^)=[1个⋯1个⋮⋱⋮1个⋯1个] \mbox{Cor}\left(\mathbf{e},\hat{\mathbf{y}}\right) = \left[\begin{array}{ccc}1 & \cdots & 1 \\ \vdots & \ddots & \vdots \\ 1 & \cdots & 1\end{array}\right] (其中左侧的表达式是残差和拟合值之间的方差-协方差矩阵),这可以解释为什么第二和第三曲线与Faraway的解释一致。 但是是这样吗?如果不是,那么法拉威对第二和第三情节的解释又如何呢?另外,为什么第三幅图必然表示非线性?它是否可能是线性的,但是误差不是正态分布的,还是不是正态分布的,而是不以零为中心?


4
图形模型中的图论在哪里?
图形模型的介绍将它们描述为“ ...图论与概率论之间的结合”。 我得到了概率论的一部分,但是我对理解图论到底适合什么地方有困难。从图论中得到什么见解帮助加深了我们对不确定性下的概率分布和决策的理解? 除了在PGM中图形理论术语的明显使用之外,我正在寻找具体的示例,例如将PGM分类为“树”或“二分”或“无向”等。


1
马尔可夫随机场何时
在他们的教科书,图形模型,指数族和变推理,M.乔丹和M.温赖特讨论之间的联系指数家属和马尔可夫随机场(无向图模型)。 我试图通过以下问题更好地理解它们之间的关系: 所有MRF都是指数家族的成员吗? 指数族的所有成员都可以代表MRF吗? 如果MRF指数族,那么其中一种不包含在另一种类型中的分布的良好示例是什么?≠≠\neq 根据我在他们的教科书(第3章)中的理解,乔丹和温赖特提出了下一个论点: 说,我们有如下一些分布AA标随机变量X,并得出独立同分布的观测,我们要找出。n X 1,… X n ppppñnnX1个,… XñX1,…XnX^1, \ldots X^nppp 我们计算某些函数的经验期望ϕαϕα\phi_\alpha% μ^α= 1ñ∑ñ我= 1ϕα(X一世),μ^α=1n∑i=1nϕα(Xi),\hat{\mu}_\alpha= \frac{1}{n}\sum^n_{i=1}\phi_\alpha(X^i), 对于所有α ∈ 我α∈I\alpha \in \mathcal{I} 其中某个中的每个索引一个函数我φ α:X → řαα\alpha一世I\mathcal{I}ϕα:X→ Rϕα:X→R\phi_\alpha: \mathcal{X} \rightarrow R 然后,如果我们强制以下两组数量是一致的,即匹配(以标识):ppp 分布的充分统计的期望值φ pËp[ (ϕα(X)] = ∫Xϕα(x )p (x )ν(dX )Ep[(ϕα(X)]=∫Xϕα(x)p(x)ν(dx)E_p[(\phi_\alpha(X)]=\int_\mathcal{X}\phi_\alpha(x)p(x)\nu(dx)ϕϕ\phippp 经验分布下的期望 在存在 与观察值一致的许多分布的意义上,我们得到了一个不确定的问题。因此,我们需要一个在它们之间进行选择的原则(以标识)。ppppppp 如果我们使用最大熵的原理消除这种不确定性,我们可以得到一个:ppp p∗= 一个ř 克中号一个Xp …


3
了解因果贝叶斯网络中的d分离理论
我试图了解因果贝叶斯网络中的d-分离逻辑。我知道算法的工作原理,但我不完全理解为什么 “信息流”如算法中所述工作。 例如,在上图中,让我们以为我们只有X,没有观察到其他变量。然后根据d分离的规则,信息从X流向D: X影响A,这是P(A )≠ P(A | X)P(一种)≠P(一种|X)P(A)\neq P(A|X)。可以,因为A导致X,并且如果我们知道X的影响,那么这会影响我们对原因A的信念。信息流。 X影响B,即P(B )≠ P(B | X)P(乙)≠P(乙|X)P(B)\neq P(B|X)。这是可以的,因为由于我们对X的了解而改变了A,所以A处的更改也会影响我们对其原因B的信念。 X影响C,即。之所以可以,是因为我们知道B受其间接效应X的偏见,并且由于B受X的偏见,这将影响B的所有直接和间接影响。C是B的直接效应,它受我们对X的了解的影响。P(C)≠ P(C| X)P(C)≠P(C|X)P(C)\neq P(C|X) 好了,到目前为止,对我来说一切都很好,因为信息流是根据直观的因果关系发生的。但是在这种方案中,我没有得到所谓的“ V型结构”或“对撞机”的特殊行为。根据d-分离理论,B和D是上图中C的常见原因,它表示,如果我们未观察到C或其任何后代,则来自X的流量信息将在C处阻塞。 ,但是我的问题是为什么? 从上面的三个步骤开始,从X开始,我们看到C受关于X的知识的影响,并且信息流根据因果关系发生。d-分离理论说,由于没有观察到C,所以我们不能从C转到D。但是我认为,既然我们知道C是有偏见的,而D是C的原因,那么D也应该受到影响,而理论却相反。我显然在思维模式中缺少某些东西,但看不到它是什么。 因此,我需要一个解释,说明如果没有观察到C,为什么信息流会阻塞在C处。

2
Stan中没有定义先验的参数
我刚刚开始学习使用Stan和rstan。除非一直对JAGS / BUGS的工作方式感到困惑,否则我一直认为您必须为要从中提取模型的每个参数定义某种先验分布。似乎您不必根据Stan的文档在Stan中执行此操作。这是他们在此处提供的示例模型。 data { int<lower=0> J; // number of schools real y[J]; // estimated treatment effects real<lower=0> sigma[J]; // s.e. of effect estimates } parameters { real theta[J]; real mu; real<lower=0> tau; } model { theta ~ normal(mu, tau); y ~ normal(theta, sigma); } 既mu没有tau定义先验也没有。在将我的一些JAGS模型转换为Stan时,我发现如果我对许多参数(大多数)具有未定义的先验值,它们将起作用。 问题是,当我有没有定义的先验的参数时,我不理解Stan在做什么。是否默认为统一分布?这是HMC的特殊属性之一,它不需要为每个参数都定义一个先验吗?


4
有向无环图中的边是否代表因果关系?
我正在学习概率图形模型,这是一本用于自学的书。有向无环图(DAG)中的边是否代表因果关系? 如果我想构建贝叶斯网络,但不确定箭头的方向怎么办?所有数据将告诉我观察到的相关性,而不是它们之间的相互联系。我知道我要问的太多了,因为我确信接下来的章节将解决这些问题,但这只是我不能停止思考的原因。

3
将神经网络数学建模为图形模型
我正在努力在神经网络和图形模型之间建立数学联系。 在图形模型中,这个想法很简单:概率分布根据图中的派系分解,势通常为指数族。 神经网络是否有等效的推理?能否用受限的玻尔兹曼机或CNN表示单位(变量)上单位(变量)随其能量或单位之间能量乘积的概率分布? 另外,概率分布是否由指数族的RBM或深度信仰网络(例如带有CNN)建模? 我希望找到一种文本,这些文本以约旦和温赖特(Jordan&Wainwright)的图形模型,图形族,指数族和变分推论对图形模型所做的相同方式,来形式化这些现代神经网络和统计之间的联系。任何指针都很棒。

1
动态贝叶斯系统的定义及其与HMM的关系?
来自维基百科 动态贝叶斯网络(DBN)是贝叶斯网络,它在相邻的时间步长上相互关联变量。这通常被称为“两倍时间BN”,因为它表示在任何时间点T上,变量的值都可以从内部回归值和紧邻的先验值(时间T-1)中计算出来。DBN在机器人技术中很常见,并且已经显示出了广泛的数据挖掘应用程序的潜力。例如,它们已用于语音识别,蛋白质测序和生物信息学。DBN已显示出产生与隐马尔可夫模型和卡尔曼滤波器等效的解决方案。 我想知道“即时优先值(时间T-1)”是否意味着DBN中的时间索引始终是离散的? “在任何时间点T上,都可以从内部回归变量中计算出变量的值,并且立即数在先值(时间T-1)”是否意味着DBN是离散时间的马尔可夫过程? 如果我理解正确,那么如果同时忽略状态的输出,那么HMM也是离散时间的马尔可夫过程。所以我想知道HMM和DBN是否是相同的概念?但是另一篇维基百科文章 说 隐马尔可夫模型(HMM)是一种统计马尔可夫模型,其中将要建模的系统假定为具有未观察(隐藏)状态的马尔可夫过程。HMM可被视为最简单的动态贝叶斯网络。 第一篇文章还有另一句话: DBN已显示出产生与隐马尔可夫模型和卡尔曼滤波器等效的解决方案。 谢谢!

2
图形模型和玻尔兹曼机器在数学上相关吗?
虽然我实际上是在物理课上用玻尔兹曼机进行编程的,但我对它们的理论特性并不熟悉。相反,我对图形模型的理论了解很少(关于Lauritzen的《图形模型》的前几章)。 问题:图形模型和玻尔兹曼机器之间是否存在有意义的关系?玻尔兹曼机是图形模型的一种吗? 显然,玻尔兹曼机是一种神经网络。我听说有些神经网络在数学上与图形模型有关,而有些则没有。 CrossValidated上的相关问题没有回答我的问题: 这类似于之前已经问过的先前问题:层次模型,神经网络,图形模型,贝叶斯网络之间的关系是什么?但更具体。 此外,对该问题的公认答案并不能澄清我的困惑-即使神经网络的标准图形表示中的节点不表示随机变量,也不一定意味着不存在这种表示形式。具体来说,我正在考虑马尔可夫链的典型图形表示中的节点如何表示可能状态的集合,而不是随机变量,但是也可以创建一个图形,显示之间的条件依赖关系XiXiX_iXiXiX_i,这表明每个马尔可夫链实际上都是一个马尔可夫随机场。答案还说,神经网络(可能包括Boltzmann机器)是“判别性的”,但没有更详细地解释该主张的含义,也没有明显的后续问题“图形模型不是可判别的吗?” 已解决。同样,可接受的答案链接到凯文·墨菲(Kevin Murphy)的网站(当我学习贝叶斯网络时,我实际上阅读了他的博士学位论文),但是该网站仅讨论贝叶斯网络,而根本没有提及神经网络,因此无法阐明它们的方式。是不同的。 这另一个问题可能与我的最相似:将神经网络数学建模为图形模型但是,没有一个答案被接受,同样也仅提供参考,但不解释参考(例如,此答案)。希望有一天我能够理解这些参考资料,但现在我已经具备基本的知识水平,并且最希望得到一个尽可能简化的答案。此外,链接到顶部答案(http://www.cs.toronto.edu/~tijmen/csc321/lecture_notes.shtml)的多伦多课程解决了此问题,但没有非常详细。此外,可能无法回答我的问题的一次讲座的笔记也没有公开。 3月25日,讲座13b:信仰网7:43。对于此幻灯片,请记住Boltzmann Machines。那里也有隐藏的单位和可见的单位,而且都是概率性的。BM和SBN的共同点是多于区别。9:16 如今,“图形模型”有时被视为神经网络的特殊类别,但在此处描述的历史中,它们被认为是非常不同的系统类型。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.