Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。

1
ML指数分布的估计值(带有检查数据)
在生存分析中,假设rv的生存时间呈指数分布。现在考虑我有i_1 rv的 “结果” 。这些结果中只有一部分实际上是“完全实现”的,即其余观察结果仍然是“有效的”。XiXiX_ix1,…,xnx1,…,xnx_1,\dots,x_nXiXiX_i 如果我想对分布的速率参数进行ML估计,该如何以连贯/适当的方式利用未实现的观测值?我相信它们仍然包含有用的信息以供估算。λλ\lambda 有人可以指导我阅读有关该主题的文献吗?我确定它存在。但是,我很难找到适合该主题的关键字/搜索字词。

1
从鉴定到估计
我目前正在阅读Pearl的文章(Pearl,2009年,第二版),探讨因果关系,并努力建立模型的非参数识别与实际估计之间的联系。不幸的是,珀尔本人对此话题非常沉默。 举个例子,我想到一个简单的因果关系模型, x→z→yx→z→yx \rightarrow z \rightarrow y,以及影响所有变量的混杂因素 w→xw→xw \rightarrow x, w→zw→zw \rightarrow z 和 w→yw→yw \rightarrow y。此外,xxx 和 yyy 受到不可观察的影响, x←→yx←→yx \leftarrow \rightarrow y。根据微积分规则,我现在知道干预后(离散)的概率分布由下式给出: P(y∣do(x))=∑w,z[P(z∣w,x)P(w)∑x[P(y∣w,x,z)P(x∣w)]].P(y∣do(x))=∑w,z[P(z∣w,x)P(w)∑x[P(y∣w,x,z)P(x∣w)]]. P(y \mid do(x)) = \sum_{w,z}\bigl[P(z\mid w,x)P(w)\sum_{x}\bigl[P(y\mid w,x,z)P(x\mid w)\bigr]\bigr]. 我知道不知道如何估算此数量(非参数或通过引入参数假设)?特别是当www是一组混杂变量,并且关注的数量是连续的。在这种情况下,估计联合干预前的数据分布似乎非常不切实际。有人知道处理这些问题的Pearl方法的应用吗?我很高兴获得一个指针。

2
使用Poisson回归估算二元数据中调整后的风险比率
我对估算调整后的风险比率很感兴趣,类似于人们如何使用logistic回归估算调整后的优势比率。一些文献(例如this)表明,将泊松回归与Huber-White标准误差一起使用是基于模型的方法 我没有找到关于调整连续协变量如何影响这一点的文献。下面的简单模拟表明此问题并非那么简单: arr <- function(BLR,RR,p,n,nr,ce) { B = rep(0,nr) for(i in 1:nr){ b <- runif(n)<p x <- rnorm(n) pr <- exp( log(BLR) + log(RR)*b + ce*x) y <- runif(n)<pr model <- glm(y ~ b + x, family=poisson) B[i] <- coef(model)[2] } return( mean( exp(B), na.rm=TRUE ) ) } set.seed(1234) arr(.3, …

1
测试两个二项分布的样本是否符合相同的p
假设我已经完成: ñ1个ñ1个n_1独立试验,成功率未知,观察到成功。p1个p1个p_1ķ1个ķ1个k_1 ñ2ñ2n_2独立试验,成功率未知,观察到成功。p2p2p_2ķ2ķ2k_2 如果现在但仍然未知,则对于给定的观测的概率(反之亦然)与,所以如果我要测试p_1 \ neq p_2,则只需要查看观察值对应分布的哪个分位数即可。p1个=p2= : pp1个=p2=:pp_1 = p_2 =: pp (ķ2)p(ķ2)p(k_2)ķ2ķ2k_2ķ1个ķ1个k_1∫1个0B (ñ1个,p ,ķ1个)B (ñ2,p ,ķ2)d p =1个ñ1个+ñ2+ 1(ñ1个ķ1个)(ñ2ķ2)(ñ1个+ñ2ķ1个+ķ2)− 1∫01个乙(ñ1个,p,ķ1个)乙(ñ2,p,ķ2)dp=1个ñ1个+ñ2+1个(ñ1个ķ1个)(ñ2ķ2)(ñ1个+ñ2ķ1个+ķ2)-1个\int_0^1 B(n_1,p,k_1) B(n_2, p, k_2) \text{d}p = \frac{1}{n_1+n_2+1}\binom{n_1}{k_1}\binom{n_2}{k_2}\binom{n_1+n_2}{k_1+k_2}^{-1}p1个≠p2p1个≠p2p_1 \neq p_2 到目前为止,是为了重新发明轮子。现在我的问题是我无法在文献中找到它,因此我想知道:此测试的技术术语是什么?

3
有关统计生态学的书籍?
我知道之前曾问过这个问题:生态学参考书,但这不是我想要的。 我在寻找的是是否有人可以推荐一本关于统计生态学的好书(或规范的参考书)?我对统计数据有很好的理解,因此该书确实可以适用于任何水平。我会用这本书来教自己更多关于统计学在生态学中的应用,而不是其他任何东西,因此,即使是一本带有良好/有趣示例的入门书,也将不胜感激。另外,我的研究倾向于针对贝叶斯统计,因此结合贝叶斯统计的书甚至更好!

1
用于(最佳)实验统计设计的良好,有用和特征性实验
与替代的有效设计策略相比,可以应用实验设计的现象更多。这是对的,尽管有许多方法可以适当地设计实验。 什么是最好的“问题”,才能真正证明不同类型的实验优化设计的价值和细微差别?(A,D,E,C,V,phi,....) 您能否提供书籍,链接,文章,参考资料,或者至少提供以经验为依据的良好见解?


2
预订非参数统计
对于非参数统计而言,这将是一本好书。不只是介绍,而是高级。另外,我正在寻找可用于学习而非参考的东西。 特别是我正在寻找一本书,其中可能包含非参数方法,非参数推断,评估非参数的方法(例如KS测试,检验等),自举...的基础知识。ttt


1
频繁统计的参考资料,精通现代概率论的某人
来自严格的分析和现代概率论背景,我发现贝叶斯统计信息简单明了,易于理解,常客统计数据令人难以置信且令人困惑。似乎常客确实是在做贝叶斯统计,除非动机和动机没有明确定义的“秘密先验”。 另一方面,很多了解这两种观点的伟大统计学家都将归因于惯常论者的观点,因此那里肯定有些我不理解的东西。我不想放弃并宣布自己是贝叶斯主义者,而是想了解更多关于常客主义的观点,以尝试真正地“理解”它。 从严格的角度来学习频率统计资料有哪些好的参考?理想情况下,我正在寻找能防止定理定理的书籍,或者通过解决这些困难的习题集,可以获得正确的心态。我已经读过很多可能在互联网上找到的“哲学性东西”,例如Wiki页面,.edu /〜randomprof网站中的随机pdf等,但它没有帮助。

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


4
如何在2 X 3桌子上进行多个事后卡方检验?
我的数据集包括近海,中海道和近海三种地点类型的生物的总死亡率或生存率。下表中的数字表示站点数。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 我想知道根据地点​​类型,发生100%死亡率的地点数量是否显着。如果我运行2 x 3卡方,则会得到显着的结果。我是否可以进行事后成对比较,或者实际上应该使用对数方差分析或二项分布的回归?谢谢!

4
统计员进行数值优化的参考
我正在寻找针对统计学家的数值优化技术的可靠参考,也就是将这些方法应用于某些标准推论性问题(例如,通用模型中的MAP / MLE)。诸如梯度下降(直线和随机),EM及其衍生/概括,模拟退火等。 我希望它会有一些有关实现的实用说明(因此常常缺少论文)。它不必完全明确,但至少应提供可靠的书目。 一些粗略的搜索出现了几篇文章:Ken Lange的《统计学家的数值分析》和John Monahan的《统计学的数值方法》。每个人的评论似乎是混杂的(稀疏的)。在这两个书中,对目录的细读表明兰格的书的第二版与我所追求的最接近。

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.