Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。

3
在逻辑回归(或其他形式的回归)中测试非线性
Logistic回归的一种假设是logit中的线性。因此,一旦我建立了模型并开始运行,就可以使用Box-Tidwell测试来测试非线性。我的一个连续预测变量(X)对非线性进行了正面测试。我接下来该怎么办? 因为这违反了假设,所以我应该摆脱预测变量(X)或包括非线性变换(X * X)。还是将变量转换为分类变量?如果您有参考,也可以给我指出吗?


3
图书初学者关于概率分布的建议
我正在学习机器学习,打开的每一本书都碰到卡方分布,伽马函数,t分布,高斯分布等。 到目前为止,我读过的每一本书都只定义了分布:它们并不能解释或给出函数的特定公式从何而来的直觉。 例如,为什么卡方分布是这样?什么是t分布?发行背后的直觉是什么?证明?等等 我想对最常用的分布有一个清晰而基本的了解,以便以后每次看到它们时,我都能真正理解什么是t分布,什么是高斯分布,最重要的是为什么它们如此他们是。 如果书籍/教程可以向外行解释这些概念,这样您就不必了解它们就可以了。x)许多书籍都是这样的,它们不适合初学者:(

5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


5
贝叶斯主义者是否曾经争论过,在某些情况下他们的方法与惯常方法相提并论/重叠?
贝叶斯主义者是否曾经争论说他们的方法可以归纳为常人主义方法,因为人们可以使用非信息先验,因此可以恢复典型的常人主义模型结构? 如果确实使用过这种说法,谁能将我引到一个我可以阅读该论点的地方? 编辑:这个问题的措词可能不完全是我想表达它的方式。问题是:“是否有讨论使用贝叶斯方法和频繁主义者方法通过使用特定先验来重叠/相交/具有共同点的情况的讨论?” 一个例子是使用不适当的先验,但是我很确定这只是冰山一角。p (θ )= 1p(θ)=1p(\theta) = 1



4
咨询统计学家以向其客户提供参考
这个问题说明了面对像维基百科这样的资源匮乏的人,自己独自掌握统计数据和概率的困难。 在我看来,咨询统计学家(这里有些人会)通常会面临向客户解释某些概念和方法的挑战。这是教学硬币的另一面。掌握了这一概念后,进行某种特定的分析可能很有意义,但是一个人的参考文献可能不合适或难以与客户共享。那么,咨询统计学家是否喜欢向客户建议的共同资源?(有关更高级或专门的主题,请参阅更新#1。) 我可以想到一些有用的书籍,但是我怀疑很多客户会像Developer一样去搜索网络,并且会在Wikipedia上看到相当荒唐的资料。在我对开发人员的答复中,我建议使用《NIST手册》作为此类参考。还有什么? 更新1:正如Peter Flom所指出的那样,对于更高级的材料或更狭窄的研究,提供单个参考点可能并不容易。这是正确的,对于那些情况,我应该用不同的措词表达问题。在这种情况下,顾问如何找到并共享可访问的参考资料?我相信许多顾问会花时间写一些新的东西来向客户解释事情,但是这些并不是找到和共享的参考。 一些想法: 顾问或其他人编写的教程 案例研究或分析表明相同的概念 书籍摘录(正如我在对开发者的回答中所建议的那样),描述了概念 还有什么可能是来源,或者您实际上将如何寻找这些参考?我意识到这是一个开放式问题,但是我对Developer的回答显示了我解决该问题的一些方法。我并不是要问所有可以解决此问题的方法,而是以自己的经验,您通常如何提供这种解释性资源?

9
本书提供了统计方法的广泛而概念性的概述
我对统计分析在模拟/预测/功能估计等方面的潜力非常感兴趣。 但是,我对此并不太了解,我的数学知识仍然非常有限-我是软件工程专业的一名本科生。 我正在寻找一本可以让我开始不断学习的东西的书:线性回归和其他类型的回归,贝叶斯方法,蒙特卡洛方法,机器学习等。我也想开始使用R,所以如果有一本书将两者结合在一起,真是太棒了。 最好是,我希望这本书从概念上而不是过多的技术细节上进行解释-我希望统计数据对我来说非常直观,因为我知道统计数据存在很多风险。 我当然愿意阅读更多书籍,以增进对我认为有价值的主题的理解。

3
从使用统计软件过渡到理解数学方程式?
内容: 我是心理学博士研究生。与许多心理学博士生一样,我知道如何使用统计软件进行各种统计分析,以及PCA,分类树和聚类分析等技术。但这并不能真正令人满意,因为尽管我可以解释为什么进行分析以及指标的含义,但无法解释该技术的工作原理。 真正的问题是,掌握统计软件很容易,但是却受到限制。要学习文章中的新技术,我需要了解如何阅读数学方程式。目前,我无法计算特征值或K均值。方程对我来说就像一门外语。 题: 是否有全面的指南可帮助您理解期刊文章中的方程式? 编辑: 我认为这个问题将更加自我解释:在一定的复杂性之上,统计符号对我来说变得毫无意义。假设我想用R或C ++编写自己的函数以了解一种技术,但是有一个障碍。我无法将方程式转换为程序。确实:我不知道美国博士学位学校的情况,但是在我的(法国),我唯一可以学习的课程是大约16世纪的文学运动...

1
在线,可扩展的统计方法
这受到高效在线线性回归的启发,我发现这非常有趣。是否有专门用于大规模统计计算的文本或资源,通过这些文本或资源进行的数据集计算过大而无法放入主存储器中,并且可能变化太多而无法有效地进行子采样。例如,是否可以在线方式拟合混合效果模型?有没有人研究过用一阶SGD型技术替换MLE的标准二阶优化技术的效果?




By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.