Questions tagged «simulation»

广阔的领域包括通过计算机模型生成结果。

1
如何比较观察到的事件与预期的事件?
假设我有一个频率为4个可能的事件的样本: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和(18),我可以计算事件的预期频率,对吗? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
模拟分布
我正在进行能力规划任务,并且已经阅读了一些书籍。这特别是关于分布。我用R 建议使用什么方法来确定我的数据分布是什么?有统计方法可以识别它吗? 我有这张图。 使用R有哪些可用的模拟方法?在这里,我想为特定分布(例如指数)生成数据。如果我想将r-java与Java集成,它是正确的方法吗? 当我通过管道传输特定分布的数据时,是否可以预测效果(CPU使用率等)的分布?发送某些数据分布有什么不同的影响? 请考虑这些作为初学者的问题。是否有涉及此类模拟的书籍或材料? 笔记 该图摘自论文的结尾http://people.stern.nyu.edu/adamodar/pdfiles/papers/probabilistic.pdf。 我遇到过的健身技巧 拟合优度评估 卡方 柯尔莫哥洛夫-斯米尔诺夫, Anderson-Darling统计密度,CDF,PP和QQ图 如果我发现我的分布是正态分布或指数分布等,我不确定该怎么解释或下一步应该做些什么?它可以做什么?预测?希望这个问题清楚。 根据我的尼尔·冈瑟(Neil Gunther)的《能力规划》一书,指数延迟会导致队列波动。所以我知道这一点。

2
如何在R中模拟重复测量的多元结果?
@whuber已经演示了如何在一个时间点上模拟多元结果(,和)。ÿ1个y1y_1ÿ2y2y_2ÿ3y3y_3 众所周知,纵向数据经常出现在医学研究中。我的问题是如何在R中模拟重复测量的多元结果?例如,对于两个不同的治疗组,我们在5个不同的时间点重复测量,和。ÿ1个y1y_1y2y2y_2y3y3y_3


3
如何使用1%的微数据样本大规模地模拟小区域的人口普查微数据,以及如何在小区域尺度上进行汇总统计?
我想在较小的地理汇总水平(澳大利亚人口普查收集区)中执行个人级别的多元分析。显然,出于隐私原因,无法在这些较小的汇总级别进行人口普查,因此我正在研究其他替代方案。几乎所有感兴趣的变量都是分类变量。我有两个数据集可供使用: 1%的人口普查样本可用于更高级别的空间聚集(一个人口约为190,000且人口统计学的空间分隔较大的区域)。 我在小区域级别上感兴趣的变量的频率表(500个小区域,平均pop = 385,sd = 319,中位数= 355)。 如何使用这两个数据集在小面积级别模拟尽可能接近小面积实际人口的人口分布? 我很欣赏可能有常规的方法来执行此操作;如果是这样,将非常感谢您提供教科书或相关期刊文章的指针。

1
如何从先验和似然计算后验密度估计?
我试图了解如何使用贝叶斯定理来计算后验,但被计算方法所困扰,例如,在以下情况下,我不清楚如何获取先验和似然的乘积,然后计算出后: 对于此示例,我有兴趣计算的后验概率,并且在上使用标准正态先验,但是我想知道如何通过MCMC链表示的上的先验计算后验,因此我将使用1000个样本作为起点。μμ\muμμ\mu p (μ )〜Ñ(μ = 0 ,σ= 1 )p(μ)∼N(μ=0,σ=1)p(\mu)\sim N(\mu = 0, \sigma = 1)μμ\mu 从先前的样本1000。 set.seed(0) prior.mu <- 0 prior.sigma <- 1 prior.samples <- sort(rnorm(1000, prior.mu, prior.sigma)) 做一些观察: observations <- c(0.4, 0.5, 0.8, 0.1) 并计算可能性,例如:p (ÿ| μ,σ)p(y|μ,σ)p(y | \mu, \sigma) likelihood <- prod(dnorm(observations, mean(prior.samplse), sd(prior.samples))) 我不太了解的是: 什么时候/如何将先验乘以可能性? 什么时候/如何规范后验密度? …

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.