Questions tagged «copula»

系动词是具有均匀边际分布的多元分布。Copulas通常用于表示或建模随机变量与边际分布分开的依存关系。


5
关于Copulas的入门阅读
一段时间以来,我一直在为我的研讨会寻找有关Copulas的良好介绍性阅读。我发现有很多关于理论方面的材料,这是很好的,但是在我将其介绍之前,我希望对这一主题建立良好的直观理解。 谁能提出建议为初学者打好基础的好论文(我在合理的程度上开设了1-2门统计学课程,并了解边际,多元分布,逆变换等)?

1
对数正态随机变量可获得的相关性
考虑具有和的对数正态随机变量和。X1个X1个X_1X2X2X_2日志(X1个)〜Ñ(0 ,1 )日志⁡(X1个)〜ñ(0,1个)\log(X_1)\sim \mathcal{N}(0,1)日志(X2)〜Ñ(0 ,σ2)日志⁡(X2)〜ñ(0,σ2)\log(X_2)\sim \mathcal{N}(0,\sigma^2) 我正在尝试为\ rho(X_1,X_2)计算和\ rho _ {\ min}。给定解决方案中的一个步骤是:ρ最高ρ最高\rho_{\max}ρ分ρ分\rho_{\min}ρ (X1个,X2)ρ(X1个,X2)\rho (X_1,X_2) ρ最高= ρ (exp(Z),exp(σž))ρ最高=ρ(经验值⁡(ž),经验值⁡(σž))\rho_{\max}=\rho (\exp(Z),\exp(\sigma Z))和 ρ分= ρ (exp(Z),exp(- σž))ρ分=ρ(经验值⁡(ž),经验值⁡(-σž))\rho_{\min}=\rho (\exp(Z),\exp(-\sigma Z)), 但是他们提到了同调性和反共声性。我希望有人能帮助我了解他们之间的关系。(我知道如何从一般表达式中获得此信息,但想具体了解共调性部分在说什么。)

1
多元标准正态分布与高斯copula之间的差异
我想知道多元标准正态分布与高斯copula之间的区别是什么,因为当我查看密度函数时,它们在我看来是相同的。 我的问题是为什么引入高斯系动词或高斯系动词产生什么好处,或者当高斯系动词只不过是多元标准正态函数本身时其优势是什么。 还有copula中概率积分变换背后的概念是什么?我的意思是我们知道,系动词是具有统一变量的函数。为什么必须统一?为什么不使用诸如多元正态分布之类的实际数据并找到相关矩阵?(通常,我们绘制这两种资产收益以考虑它们之间的关系,但是当它是copula时,我们绘制的是概率为US的资产。) 另一个问题。我还怀疑来自MVN的相关矩阵是否可以像copula一样是非参数的或半参数的(因为copula参数可以是kendall's tau等)。 由于我是该领域的新手,我将非常感谢您的帮助。(但是我读了很多论文,而这些是我唯一不了解的内容)

1
copula密度的上限?
的Fréchet可-Hoeffding上限适用于连接函数分布函数,它是由下式给出 C(u1,...,ud)≤min{u1,..,ud}.C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. 系密度而不是CDF 是否有相似的上限(在某种程度上取决于边际密度)?c(u1,...,ud)c(u1,...,ud)c(u_1,...,u_d) 任何参考将不胜感激。

1
如何从高斯copula模拟?
假设我有两个单变量边际分布,即FFF和GGG,可以从中进行模拟。现在,使用表示为C (F ,G ; Σ )的高斯copula构造它们的联合分布。所有参数都是已知的。C(F,G;Σ)C(F,G;Σ)C(F,G;\Sigma) 是否有非MCMC方法可以从此系动中模拟出来?

2
有什么技术可以对两个相关的随机变量进行采样?
有什么技术可以对两个相关的随机变量进行采样: 如果其概率分布已参数化(例如,对数正态) 如果它们具有非参数分布。 数据是两个时间序列,可以为它们计算非零相关系数。假设历史相关性和时间序列CDF不变,我们希望将来模拟这些数据。 对于情况(2),一维类似物将用于构建CDF并从中采样。所以我想我可以构造一个二维CDF并做同样的事情。但是,我想知道是否有一种方法可以通过使用单个的一维CDF并以某种方式链接这些选项。 谢谢!

2
相关的伯努利试验,多元伯努利分布?
我正在简化我正在工作的研究问题。想象一下,我有5个硬币,让我们称之为成功。这些是非常有偏见的硬币,成功概率为p = 0.1。现在,如果硬币是独立的,那么获得至少1个头或更多的概率非常简单,即。在我的情况下,我的伯努利试验(掷硬币)不是独立的。我获得的唯一信息是成功的概率(每个概率为p = .1)和二进制变量之间的理论Pearson相关性。1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 有什么方法可以仅凭此信息来计算一次成功或更多次成功的概率?我试图避免基于仿真的方法,因为这些理论结果将用于指导仿真研究的准确性。我一直在研究多元伯努利分布,但我认为仅凭相关性和成功的边际概率不能完全说明它。我的一个朋友建议构造一个具有bernoulli边际的高斯copula(使用R包copula),然后pMvdc()在一个大样本上使用该函数来获得我想要的概率,但是我不确定如何处理它。

5
产生相关非正态数据的方法
我对寻找一种生成相关的非正常数据的方法感兴趣。因此,理想情况下,某种类型的分布将协方差(或相关)矩阵作为参数,并生成近似该分布的数据。但是这里有个要点:我试图找到的方法应该具有灵活性,也可以控制其多元偏度和/或峰度。 我熟悉Fleishman的方法和正态变量的幂方法的使用,但是我相信大多数扩展只允许用户使用边际偏度和峰度的某些组合,而将多元偏度/峰度留在那儿。我想知道的是,是否有一种方法可以帮助指定多元偏度和/或峰度,以及一些相关性/协方差结构。 大约一年前,我参加了一次关于系蝇分布的研讨会,我记得这位教授随便提到了通过使用葡萄系蝇,一个人可以产生的数据在其一维边缘中的每一个都对称,但共同偏斜,反之亦然。 -反之亦然。或者,甚至更进一步,任何维数较低的边距在保持最大维数对称(或不对称)的同时,可能会有些偏斜或峰度。我一直对这种灵活性可能存在的想法感到惊讶,我一直试图找到某种描述上述方法的文章或会议论文,但我没有成功:(。不必通过使用copulas,我愿意接受任何可行的方法。 编辑:我添加了一些R代码,以尝试显示我的意思。到目前为止,我只熟悉Mardia对多元偏斜和峰度的定义。当我第一次解决问题时,我天真地想到如果我使用具有偏斜边线(在本例中为beta)的对称copula(在本例中为高斯),则对边沿的单变量检验会产生显着性,但Mardia对多变量偏斜/峰度的检验会很有意义。不重要。我尝试了一下,但并没有按我预期的那样出来: library(copula) library(psych) set.seed(101) cop1 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), c("beta", "beta"),list(list(shape1=0.5, shape2=5), list(shape1=0.5, shape2=5)))} Q1 <- rmvdc(cop1, 1000) x1 <- Q1[,1] y1 <- Q1[,2] cop2 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), c("norm", "norm"),list(list(mean=0, sd=1), list(mean = 0, sd=1)))} Q2 <- rmvdc(cop2, 1000) x2 <- Q2[,1] y2 <- Q2[,2] …

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


2
混合分布的CDF逆采样
上下文外的简短版本 令为CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y > 0} 假设我想使用反CDF方法模拟绘制。那可能吗?此函数不完全具有逆函数。然后再次有两个正态分布的混合分布的逆变换采样,这表明这里有一种已知的方法可以应用逆变换采样。yyy 我知道两步法,但是我不知道如何将其应用于我的情况(请参见下文)。 带背景的长版 我使用MCMC(特别是Stan)为向量值响应拟合了以下模型:yi=(y1,…,yK)iyi=(y1,…,yK)iy^i = \left( y_1 , \dots , y_K \right)^i θik≡logit−1(αkxi),μik≡βkxi−σ2k2F(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = …

2
什么是适应性copula?
我的基本问题是:什么是适应性copula? 我有一个来自演示文稿的幻灯片(不幸的是,我不能问幻灯片的作者),关于适应性copulae的问题,我没有明白,这意味着什么。这有什么用? 这是幻灯片: 然后幻灯片继续进行更改点测试。我想知道这是关于什么的,为什么我需要与copulae有关? 幻灯片以自适应估计的参数图结尾: 这似乎表明,我的估计落后了。任何其他解释,评论都将很棒!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.