Questions tagged «theory»

有关统计理论的问题。始终还包括一个更具体的标签。


3
您能说统计和概率就像归纳法和演绎法吗?
我已经阅读了该线程,在我看来可以这样说: 统计=归纳? 概率=扣除? 但是我想知道我所缺少的比较是否还有更多细节。例如,统计量等于归纳法,还是仅仅是其特殊情况?似乎概率是演绎的一个子案例(因为它是数学思维的一个子案例)。 我知道这是一个挑剔的问题,但是从某种意义上讲,这就是为什么我要问这个问题-因为我想确保如何准确比较这些术语。

4
贝叶斯统计如何处理先验缺失?
这个问题的灵感来自于我最近的两次互动,一次是在简历中,另一次是在Economics.se。 在那里,我已经发布了一个答案,以著名的“信封悖论”(请注意,不是在 “正确答案”,而是从具体的假设,流程约情况的结构的答案)。一段时间后,一个用户发表了评论,我进行了交谈,试图了解他的观点。很明显,他在思考贝叶斯方法,并不停地谈论先验-然后我恍然大悟,我对我自己说:“等一下,谁说过任何事先什么吗?在路上,我已经制定了问题,这里没有先验条件,他们只是不需要输入图片,也不需要”。 最近,我在简历中看到了关于统计独立性的答案。我向作者评论说他的判决 “ ...如果事件在统计上是独立的,那么(根据定义)我们不能从观察另一个事件中学到任何事情。” 是公然的错误。在评论交流中,他一直回头谈(他的话) ““学习”是否意味着基于对另一个事物的观察来改变我们对事物的信念? 再一次,很明显,他正在思考贝叶斯方法,并且他认为不言而喻,我们是从某种信念(即先验)开始的,然后是我们如何更改/更新它们的问题。但是,如何建立第一至第一的信念? 由于科学必须符合现实,因此我注意到存在这样的情况,即所涉及的人类没有先例(一件事,我一直都没有任何先例地进入情况,并且请不要争辩说我确实有先例,但是我只是不了解而已,让我们在此处进行虚假的精神分析)。 因为我碰巧听到过“无信息先验”一词,所以我将问题分为两个部分,并且我可以肯定,在贝叶斯理论中精通的用户确切知道我要问的问题: 问题1:是否没有先验等价物(从严格的理论意义上讲)与没有信息的先验相提并论? 如果对Q1的回答是“是”(请作详细说明),则意味着贝叶斯方法是普遍适用的,并且从一开始就适用,因为在任何情况下,涉案人员都宣称“我没有先验”,我们可以补充一下。它所处的先验地位对于手头的案件没有多大意义。 但是,如果对Q1的回答为“否”,那么Q2就会出现: 问题2:如果问题1的答案为“否”,是否表示在没有先验条件的情况下,贝叶斯方法从一开始就不适用,我们必须首先通过某种非贝叶斯方法形成先验条件,这样我们就可以随后应用贝叶斯方法了?

1
我应该知道哪些因果理论?
作为应用统计学家/计量经济学家,我应该知道哪种因果关系理论方法? 我知道(一点点) Neyman–Rubin因果模型(以及Roy,Haavelmo等) 珍珠的因果关系工作 格兰杰因果关系(尽管较少以治疗为导向) 我想念或应该了解哪些概念? 相关:哪些理论是机器学习因果关系的基础? 我已阅读这些有趣的问题和答案(1,2,3),但我认为这是一个不同的问题。我很惊讶地发现,例如《统计学习要素》中没有提到“因果关系” 。

2
VC维度用于测量神经网络的复杂性的替代方法是什么?
我遇到了一些测量神经网络复杂性的基本方法: 幼稚和非正式:计算神经元,隐藏的神经元,层或隐藏层的数量 VC维度(Eduardo D. Sontag [1998]“神经网络的VC维数” [ pdf ]。) 等效于TC0dTCd0TC^0_d过程粒度和渐近计算复杂性度量。 还有其他选择吗? 首选: 如果复杂性度量可用于在相同规模上测量来自不同范式的神经网络(以测量反向传播,动力学神经网络,级联相关性等)。例如,VC维度可用于网络(甚至是神经网络以外的其他事物)上的不同类型,而神经元的数量仅在激活函数,信号(基本和尖峰)以及其他函数非常特定的模型之间有用。网络的属性是相同的。 如果它与网络可学习的功能复杂性的标准度量有很好的对应关系 如果很容易在特定网络上计算度量标准(尽管这不是必须的)。 笔记 该问题基于对CogSci.SE 的更一般的问题。

5
自学概率论书籍
有什么好书可以解释概率论的重要概念,例如概率分布函数和累积分布函数吗? 请避免引用约翰·赖斯(John Rice)的“数学统计和数据分析”之类的书籍,这些书籍从简单的置换概念开始,然后突然(在第二章中)假设真实计算,多重和表面积分知识开始飞跃,并开始描述CDF和PDF并以3维图形进行说明。一个问题是如何连接一切。 我正在寻找自学书籍,任何与“实用人的微积分”类别相同的书籍都会有很大的帮助。

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
冷漠原则是否适用于Borel-Kolmogorov悖论?
考虑杰恩斯解决贝特朗悖论用冷漠的原则。为什么类似的论点不适用于Borel-Kolmogorov悖论? 争论是否存在问题,因为问题未指定球的方向,所以旋转球不应该影响所选限制过程得出的最终分布吗?
15 theory  paradox 

1
GAM vs LOESS vs花键
语境:我想提请在不出现参数散点图一条线,所以我使用geom_smooth()的ggplot中R。它会自动返回geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.我收集的GAM代表广义加性模型,并使用三次样条曲线。 以下看法正确吗? 黄土以特定值估算响应。 样条曲线是连接适合数据的不同分段函数(构成广义加性模型)的近似值,三次样条曲线是此处使用的特定样条曲线类型。 最后,何时应使用花键,何时应使用LOESS?

3
人工神经网络背后的理论结果
我刚刚在Coursera的机器学习课程中介绍了人工神经网络,我想了解它们背​​后的更多理论。我发现他们模仿生物学的动机有些不尽人意。 从表面上看,似乎在每个级别上我们都用线性组合替换了协变量。通过反复执行,我们可以进行非线性模型拟合。这就引出了一个问题:为什么有时有时只用神经网络来拟合非线性模型就更好了。 更笼统地说,我想知道人工神经网络如何适合贝叶斯推理框架,这在ET Jaynes的书“概率论:科学逻辑”中有详细描述。或者,简单地说,为什么人工神经网络工作时会起作用?并且,当然,他们做出成功的预测意味着他们遵循了上述框架。

3
研究人员1运行1000个回归,研究人员2仅运行1,两者都得到相同的结果-他们应该做出不同的推论吗?
想象一个研究人员正在探索一个数据集并运行1000个不同的回归,他发现其中一个有趣的关系。 现在想象一下,具有相同数据的另一位研究人员 仅进行了1次回归,结果发现另一位研究人员进行了1000次回归才能找到相同的结果。研究者2不认识研究者1。 研究人员1是否应做出与研究人员2不同的推论?为什么?例如,研究人员1应该执行多重比较校正,而研究人员2不应该执行多重比较校正吗? 如果研究人员2首先向您显示了他的单一回归,您将做出什么推论?如果该研究人员1向您显示了他的结果之后,您是否应该更改自己的推断?如果是这样,那为什么重要呢? PS 1:如果谈论假设研究者使问题变得抽象,请考虑一下:假设您使用最佳方法对论文进行了一次回归。然后,另一位研究人员使用相同的数据探索了1000种不同的回归,直到发现与您运行的完全相同的回归。你们两个应该推论吗?两种情况的证据是否相同?如果您知道其他研究人员的结果,是否应该更改自己的推论?公众应如何评估两项研究的证据? PS 2:请尽量具体,并在可能的情况下提供数学/理论上的依据!

1
有哪些好的方法选择框架?
我一直在研究方法选择的理论框架(注意:不是模型选择),却发现很少有系统的,基于数学的动机。“方法选择”是指一个框架,用于针对问题或问题类型区分适当的(或更好的,最优的)方法。 我发现,即使是零星的,也可以在特定方法及其调整(即贝叶斯方法中的优先选择)以及通过偏差选择(例如归纳策略:偏向选择的语用学)的方法选择上进行大量工作。在机器学习发展的这个早期阶段,我可能是不切实际的,但是我希望找到类似测量理论在按比例类型规定可允许的转换和测试的过程中所做的事情,只是在学习问题领域发挥了重要作用。 有什么建议么?

3
数据科学家访谈问题:线性回归低,您会怎么做
我遇到了一个工作的面试问题,面试官问我,假设您的价格弹性模型的非常低(介于5%到10%之间)。您将如何解决这个问题?R2R2R^2 除了我将进行回归诊断以查看出了什么问题或是否应该应用任何非线性方法外,我什么也没想到。我以某种方式认为面试官对我的回答不满意。尽管低,在这种情况下还有其他方法可以拟合模型并用于生产水平预测吗?R2R2R^2 编辑:在稍后的阶段,他们给了我数据以在面试中对问题进行建模,我尝试添加了滞后变量,竞争对手价格的影响,季节性假人,看是否有任何不同。达到了17.6%,在保留样本上的表现很差。我个人认为将这样的模型放在实时环境中进行预测是不道德的,因为它会产生错误的结果并导致客户流失(想象一下,使用这种模型中的定价建议对您的公司收益!)。在这种情况下还有什么其他所有人都需要知道的事情吗?我不知道的什么,我很想说“银弹”?R2R2R^2 此外,让我们想象一下,添加外生变量后再提高2%,那么在这种情况下可以做什么?我们应该放弃建模项目,还是仍然有希望开发出生产水平质量的模型,该模型由保留样本的性能来表示?R2R2R^2 Edit2:我已将此问题发布在Economics.stackexchange.com论坛上,以从经济学的角度理解此问题

1
对重复实验进行仿真研究的问题解释了95%的置信区间-我在哪里做错了?
我正在尝试编写R脚本来模拟95%置信区间的重复实验解释。我发现它高估了样本的95%CI中包含某个比例的真实总体值的时间比例。差异不大-大约是96%和95%,但这仍然令我感兴趣。 我的函数samp_n从伯努利分布中随机抽取了一个样本pop_p,然后prop.test()使用连续性校正或更精确地使用来计算95%的置信区间binom.test()。如果真实人口比例pop_p包含在95%CI中,则返回1 。我编写了两个函数,一个使用prop.test(),一个使用binom.test()并具有相似的结果: in_conf_int_normal <- function(pop_p = 0.3, samp_n = 1000, correct = T){ ## uses normal approximation to calculate confidence interval ## returns 1 if the CI contain the pop proportion ## returns 0 otherwise samp <- rbinom(samp_n, 1, pop_p) pt_result <- prop.test(length(which(samp == 1)), samp_n) lb <- pt_result$conf.int[1] …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.