Questions tagged «indicator-function»

5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
对蒙特卡洛Pi估计的误解
我相当确定我了解蒙特卡洛积分的工作原理,但不了解如何用它来估算Pi。我将按照此演示文稿第5张幻灯片中概述的步骤进行操作,网址为http://homepages.inf.ed.ac.uk/imurray2/teaching/09mlss/slides.pdf 我了解初步步骤。Pi等于单位圆四分之一面积的4倍。并且以(0,0)为中心的单位圆的右上四分之一的面积等于曲线的积分,即和单位圆的右上四分之一的曲线。。 0&lt;x&lt;10&lt;x&lt;10<x<10&lt;y&lt;10&lt;y&lt;10<y<1 我不明白的是这个积分是如何 ∬I((x2+y2)&lt;1)P(x,y)dxdy∬I((x2+y2)&lt;1)P(x,y)dxdy\iint I((x^2+y^2)<1)P(x,y)dxdy 其中P(x,y)P(x,y)P(x,y)在四分之一圆周围的单位正方形中均匀分布(即,如果0&lt;x&lt;10&lt;x&lt;10<x<1且0 &lt;y &lt;1则始终等于1,否则等于0&lt;y&lt;10&lt;y&lt;10<y<10)。因此,这意味着 I((x2+y2)&lt;1)P(x,y)I((x2+y2)&lt;1)P(x,y)I((x^2+y^2)<1)P(x,y) 是在0&lt;x&lt;10&lt;x&lt;10<x<1和0 &lt;y &lt;的情况下单位圆右上象限的函数1,0&lt;y&lt;10&lt;y&lt;10<y<1但我不明白这是怎么回事,因为指标函数只能是1或0。我理解它可能是通过这种方式编写的,以简化蒙特卡洛采样(即,这是一种期望,因此仅从P(x,y)P(x,ÿ)P(x,y)并获得应用于I((x ^ 2 + y ^ 2)&lt;1)的样本的平均值一世((X2+ÿ2)&lt; 1 )一世((X2+ÿ2)&lt;1个)I((x^2+y^2)<1)),但对我来说,这在直觉上没有意义,为什么该积分表示该曲线下方的面积。 有人可以对此提供直观的解释。也许说明该积分是如何逐步生成的? 编辑: 通过将期望与某个领域相关联,我能够获得更好的理解。如果有帮助,我将在这里进行解释。首先将Pi与单位圆的右上象限区域相关联 π= 4 ×一个Ť [Rπ=4×一个Ť[R\pi=4\times A_{tr} 然后,将右上象限放入单位正方形。在单位正方形上均匀分布的情况下,圆象限的面积与从中获取样本的概率成正比。因此,以下等式成立 P(X2+ÿ2&lt; 1 )=一个Ť [R一个小号qü 一个[R êP(X2+ÿ2&lt;1个)=一个Ť[R一个sqü一个[RËP(x^2+y^2<1)=\frac{A_{tr}}{A_{square}} 并且这样一个小号qü 一个[R ê= 1一个sqü一个[RË=1个A_{square}=1 P(X2+ÿ2&lt; 1 )=一个Ť [RP(X2+ÿ2&lt;1个)=一个Ť[RP(x^2+y^2<1)=A_{tr} 并代入原方程 π= 4 × P(X2+ÿ2&lt; 1 …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.