Questions tagged «bivariate»

两个变量的联合概率分布。


3
密度估算在哪里有用?
在经过一些简短的数学之后,我认为我对内核密度估计有一点直觉。但是我也知道,就其估计量的统计特性而言,估计三个以上变量的多元密度可能不是一个好主意。 那么,在哪种情况下我应该使用非参数方法来估计双变量密度?是否有足够的价值开始担心要针对两个以上的变量进行估算? 如果您可以指向一些有关多元密度估计应用的有用链接,那就太好了。

2
关节正态性是正常随机变量总和是否正常的必要条件吗?
在我对相关问题的回答之后的评论中,用户ssdecontrol和Glen_b询问和联合正态性对于断言的正态性是否必要?当然,关节正常就足够了。在那里没有解决这个补充问题,也许值得单独考虑。Y X + YXXXYYYX+YX+YX+Y 由于联合常态意味着边际常态,我问 难道存在正常的随机变量和,使得 是一个正常的随机变量,但和是不是 共同正常的随机变量?Y X + Y X YXXXYYYX+YX+YX+YXXXYYY 如果不要求和具有正态分布,则很容易找到这样的正态随机变量。可以在我以前的答案中找到一个示例(上面提供了链接)。我认为,上面突出显示的问题的答案是“是”,并已发布(我认为是)示例作为对此问题的答案。ÿXXXYYY

5
如何从二元正态分布数据中获取椭圆区域?
我有看起来像的数据: 我尝试在其上应用正态分布(内核密度估计效果更好,但我不需要这么高的精度),并且效果很好。密度图为椭圆形。 我需要获取该椭圆函数来确定一个点是否位于椭圆区域内。怎么做? 欢迎使用R或Mathematica代码。
12 r  regression  pdf  bivariate 

1
最小风险分类器的计算阈值?
假设两个类和具有属性并具有分布和。如果我们对于以下成本矩阵具有相等的先验:C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} 为什么是最低风险(成本)分类器的阈值?x0&lt;0.5x0&lt;0.5x_0 < 0.5 这是我误会的注释示例(即,如何达到此阈值?) 编辑1:我认为对于似然比的阈值,我们可以使用P(C1)/ P(C2)。 编辑2:我从Duda Book on Pattern上添加了一些有关阈值的文本。

1
什么是“行李箱图”或“双变量箱图”?
我找到了一篇介绍箱型图的多维(此处为双变量)版本的文章-风箱图。那是什么风筝呢?我可以看到一系列基于顶点的嵌套多边形,其中一个多边形被声明为风标图。嵌套多边形构建的想法是什么?风标图是哪个多边形(中心或保持平均点数)?Bagplot的边缘是否具有一些有用的属性(例如专门划分点集)?

2
两个*相关*正态变量的总和不正常的示例
我知道一些相关的随机变量对的很好的例子,它们在边际上是正常的,但在联合上不是正常的。见这个答案由迪利普Sarwate,和这一个由红衣主教。 我也知道两个总和不正常的普通随机变量的例子。见这个答案的宏。但是在这个例子中,两个随机变量是不相关的。 是否存在两个具有非零协方差且总和不正常的普通随机变量的示例?还是有可能证明任何两个相关正态随机变量的和(即使它们不是二元正态)也必须是正态的? [上下文:我有一个作业问题,要求的分布,其中和是具有相关标准法线。我认为该问题旨在说明它们是双变量正态的。但是我想知道,如果没有非零的额外假设,是否可以X ÿ ρ ρaX+bYaX+bYaX+bYXXXYYYρρ\rhoρρ\rho 谢谢!


1
为什么Anova()和drop1()为GLMM提供了不同的答案?
我有以下形式的GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 当我使用时drop1(model, test="Chi"),我得到的结果与Anova(model, type="III")从汽车包装或汽车上获得的结果不同summary(model)。后两个给出相同的答案。 通过使用大量虚构数据,我发现这两种方法通常没有区别。对于平衡线性模型,不平衡线性模型(不同组中的n不相等)和平衡广义线性模型,它们给出相同的答案,但对于平衡广义线性混合模型,它们给出相同的答案。因此看来,只有在包括随机因素的情况下,这种矛盾才会显现出来。 为什么这两种方法之间存在差异? 使用GLMM时应使用Anova()还是drop1()应使用? 至少就我的数据而言,两者之间的差异很小。哪一个使用都重要吗?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.