Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。


3
高斯比分布:包含
我正在使用两个独立的正态分布和,均值和以及方差和。XXXÿÿYμXμX\mu_xμÿμÿ\mu_yσ2XσX2\sigma^2_xσ2ÿσÿ2\sigma^2_y 我对它们的比率的分布感兴趣。和的均值都不为零,因此不作为柯西分布。ž= X/ Yž=X/ÿZ=X/YXXXÿÿYžžZ 我需要找到的CDF ,然后对,,和取CDF的导数。žžZμXμX\mu_xμÿμÿ\mu_yσ2XσX2\sigma^2_xσ2ÿσÿ2\sigma^2_y 有人知道已经在哪里计算过的论文吗?还是我自己怎么做? 我在1969年的一篇论文中找到了CDF的公式,但是采用这些导数无疑将是一个巨大的痛苦。也许有人已经做到了,或者知道如何轻松做到这一点?我主要需要了解这些衍生物的迹象。 如果主要为正,则本文还包含解析上更简单的近似值。我不能有那个限制。但是,即使在参数范围之外,近似值也可能具有与真实导数相同的符号?ÿÿY

5
一本统计书,解释了使用比方程更多的图像
我对统计感兴趣,但是我必须承认,自从我认真使用数学以来已经有很长时间了。有时我理解方程的含义,但有时却无法理解。 我喜欢这里给出的使用箭头的图像的答案:对均方根误差和均值偏差的概念理解。 对于有关模型,PCA,模拟等的严肃统计书籍,您对使用数字而不是方程式有什么建议吗?我希望能找到一本“傻瓜统计数据”之类的书,该书可以使每个人都能获得统计数据?
28 references 

5
常见分布的真实示例
我是一名研究生,对统计感兴趣。我总体上喜欢这种材料,但是有时我很难考虑将其应用于现实生活中。具体来说,我的问题是关于常用的统计分布(正态-β-伽玛等)。我猜在某些情况下,我得到了使分布变得非常漂亮的特定属性-例如指数的无记忆属性。但是对于其他许多情况,我对教科书中常见发行版的重要性和应用领域都没有直觉。 可能有很多很好的消息源可以解决我的问题,如果您能分享这些问题,我将非常高兴。如果我可以将其与现实生活中的示例联系起来,那么我会更加热衷于该材料。

4
自我学习与受教教育?
对于程序员,有一个类似目的的问题。这个问题有一些很好的答案,但是总的主题似乎是,如果不自学,您将无所适从。 显然,编程和统计之间存在一些主要区别-使用编程,您实际上只是在学习一些基本逻辑,然后重复应用它。新语言都使用相同的基本概念。自我学习可以让您学习更高级的概念,并变得更有效率。这种东西很难教。 统计数据完全不同。应用所涉及的逻辑很容易-因为通常有人设计了该方法。实际上,该方法通常是大学所教授的大部分方法。但是统计信息确实比这更深入,并且涉及一些真正的高级概念。甚至很难找到这些概念,如果您所学的只是应用统计学,更不用说理解它们了(尽管我想知道这可能是由于该领域的行话造成的)。另外,我发现编程中的自学涉及阅读许多简短的文章/博客以向您介绍新概念,而有关统计的可访问文章几乎总是针对初学者,因此对于像这样的新手而言毫无用处。我。 因此,问题是:自学是否比大学教育更适合统计学?哪种自我学习方法可行?任何以前为人们服务的例子都将受到欢迎。 (这可能应该是社区Wiki,但是我没有看到任何复选框)

6
什么是一些有趣且写得很好的应用统计论文?
有哪些好的论文描述了统计学的应用,它们既有趣又有益于阅读?需要明确的是,我并不是真正在寻找描述新的统计方法的论文(例如,关于最小角度回归的论文),而是寻找描述如何解决实际问题的论文。 例如,第二本“交叉验证期刊俱乐部”(Cross-Validated Journal Club)的气候论文就是其中一件适合我所寻找的论文。我正在寻找更多类似于统计的论文,而不是机器学习论文,但我想这是一种模糊的区分(我将Netflix奖论文归类为临界点,而将情感分析论文归为某种东西。我不在寻找)。 我之所以问是因为,我所见过的大多数统计应用要么是您在教科书中看到的小片段,要么是与我自己的作品有关的东西,所以我想扩展一下。


1
从lmer模型计算效果的可重复性
我刚刚碰到了这篇论文,该论文描述了如何通过混合效应建模来计算测量的可重复性(又称可靠性,又称类内相关性)。R代码为: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
初学者的统计数据/概率视频
已经有要求提供“数学统计视频”的请求,但明确要求人们提供。 提供严格的统计数据数学演示的视频。也就是说,课程中可能附带使用本讨论中提到的教科书的视频... 因此,我同时想知道,您对统计/问题-101-视频课程有什么建议?
28 references 

1
写得精美的论文
摘自David Salsburg的《品尝茶的女士》: 尽管读者可能不会相信,但文学风格在数学研究中起着重要作用。一些数学作家似乎无法撰写易于理解的文章。其他人似乎因产生许多符号表示法而感到不快,这些符号表示法是如此的详细,以至于总的想法在皮卡尤尼语中迷失了。 但是,有些作者有能力以如此简单而有力的方式展示复杂的思想,以至于他们的论述似乎显而易见。只有回顾所学到的知识,读者才能意识到结果的强大力量。这样的作者是杰里·内曼(Jerzy Neyman)。很高兴阅读他的论文。这些想法自然而然地发展了,表述似乎很简单,结论似乎很自然,以至于您很难理解为什么没有人早就得出这些结果。 这些统计或机器学习方面写得很好的论文还有哪些其他具体示例? 想法是列出“这是应该怎么写”的论文清单。 请尝试提供: 完整的书目引用,例如: 卡尔·拉斯穆森(Carl E. Rasmussen),“ 无限高斯混合模型 ”,《神经信息处理系统》,第12卷,第1期。12(2000) 如果有链接,请尽可能将其链接到可公开访问的存储库(例如,http : //arxiv.org/)。 简短,非正式,易于理解的评论,涉及该论文的内容以及为什么它是写得最好的论文的一个示例。

8
寻找一本完整的概率统计书
我从来没有机会从数学系访问统计课程。我正在寻找一本完整的自给自足的概率论和统计书。完整的意思是它包含所有证明,而不仅仅是陈述结果。自给自足是指不需要阅读另一本书就能理解这本书。当然,它可能需要大学水平(数学系学生)的微积分和线性代数。 我看过多本书,但我不喜欢其中的任何一本书。 DeGroot和Schervish(2011)概率与统计(第4版)皮尔森 这还不够完整。它只是说明了很多东西而没有推导。除此之外,我喜欢它。 瓦瑟曼(Wasserman)(2004年),《所有统计资料:统计推断简明课程》。 一点都不喜欢。几乎没有解释。 David Williams的“ Weighing the Odds”比DeGroot更为正式,似乎是完整且自给自足的。但是,我发现样式很奇怪。他还发明了似乎只有他才能使用的新术语。DeGroot中解释的所有内容也在那里得到了更好的解释。 如果您知道一本很棒的德语书,那也和我是德语一样好。

1
自由度可以是非整数吗?
当我使用GAM时,它给了我剩余的DF为(代码的最后一行)。这意味着什么?超越GAM示例,通常,自由度可以是非整数吗?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

5
在生物学,心理学和医学领域使用lmer进行混合模型分析的示例报告?
由于通常的共识似乎是lmer()在R中使用混合模型而不是经典的ANOVA(由于经常提到的原因,例如不平衡设计,交叉随机效应等),我想尝试一下我的数据。但是,我担心我将这种方法“卖”给我的主管(后者希望最终进行p值的经典分析)或以后再将其“出售”给审稿人。 您能推荐一些使用混合模型或lmer()针对不同设计(例如重复测量)或针对领域生物学,心理学,医学的多个学科内部和学科之间设计的不同设计的发表文章的好例子吗?


4
二项式,负二项式和Poisson回归之间的差异
我正在寻找有关二项式,负二项式和泊松回归之间差异的信息,以及这些回归最适合哪种情况。 我是否可以在SPSS中执行任何测试,以告诉我这些回归中哪一个最适合我的情况? 另外,由于没有在回归部分可以看到的选项,因此如何在SPSS中运行泊松或负二项式? 如果您有任何有用的链接,我将非常感谢。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.