Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。

4
统计直觉/数据意义
我是一名大二学生,正在学习数学,并且我一直在与一位教授谈论数学能力和统计能力之间的差异。他提出的主要区别之一是“数据意识”,他将其解释为技术能力的结合,同时在一组我非正式地称为“常识性约束”的范围内操作,即在其中看不到问题的现实很多理论。这是我正在谈论的一个示例,该示例出现在Gowers的博客中: 在英国的一些地区,警察收集了有关道路交通事故发生地点的统计信息,确定了交通事故黑点,并在此处放置了高速摄影机,并收集了更多的统计信息。在安装了测速摄像机之后,这些黑点的事故数量肯定会下降。这是否最终表明测速摄像机可以改善道路安全性? 在谈判博弈中主张随机策略的同一个人基本上已经知道了该问题的答案。他说不,因为如果您选择极端情况,那么如果您再次运行实验,您会希望它们不会那么极端。因为没有太多要说的了,所以我决定快速解决这个问题。但是我告诉人们我有一个计划,那就是做一个假的心灵感应实验。我会让他们猜测20次抛硬币的结果,我会尝试将它们抛向心灵。然后,我会选择表现最好的三个和最差的三个,然后再次掷硬币,这次请最好的帮助我将最坏的答案传给我。人们可以轻松地看到,预期性能将得到改善,并且与心灵感应无关。 我要问的是如何通过有关该主题的任何出版物(如果有的话)或通过其他用户发现对开发此技能有帮助的方式,进一步了解这种“数据意义”。如果这个问题需要澄清,我感到抱歉。如果是这样,请发表您的问题!谢谢。

1
远距离监督:监督,半监督或两者兼而有之?
“远距离监督”是一种学习方案,其中在给定标记较弱的训练集的情况下学习分类器(训练数据基于启发式/规则自动标记)。我认为监督学习和半监督学习都可以通过“启发式/自动标记”来标记这种“远程监督”。但是,在此页面中,“远程监督”被定义为“半监督学习”(即,仅限于“半监督”)。 所以我的问题是,“远程监管”是否专门指半监管?我认为它可以应用于监督学习和半监督学习。请提供任何可靠的参考。

1
箱形图的历史如何?“箱形和晶须”设计是如何演变的?
许多消息来源至今经典的“箱线图”的设计,以约翰杜克和他的“示意图表”的1970年的设计似乎从那时起已经保持相对静态的,爱德华·塔夫特的删节箱形图的版本没有流行开来,而小提琴图 -尽管盒式图的信息更丰富-仍然不那么受欢迎。克利夫兰关于胡须延伸至第10和第90个百分位数的建议有一些支持者,请参阅Cox(2009),但这不是常态。 哈德利·威克汉姆(Hadley Wickham)和丽莎·斯特里耶夫斯基(Lisa Stryjewski)撰写了关于盒式积木历史的未发表论文,但似乎没有涵盖盒式积木的历史先驱。 那么,当前无处不在的“盒子和胡须”情节是如何产生的呢?它从什么样的数据可视化发展而来,那些早期的设计是否具有显着的优势,为什么图基的方案在使用中似乎使它们显得如此全面?图示的答案将是一个加分法,但针对比Wickham和Stryjewski更深入的历史参考将是有用的。 参考文献 新泽西州考克斯(2009)。讲故事的状态:创建和改变箱形图。Stata Journal,9(3),478。 Wickham,H.和Stryjewski,L.(2011)。40年的箱线图。http://vita.had.co.nz/papers/boxplots.pdf


1
计算和绘制LDA决策边界的图形
我从《统计学习的要素》中看到了带有决策边界的LDA(线性判别分析)图: 我知道数据被投影到较低维的子空间上。但是,我想知道我们如何在原始维度上获得决策边界,以便可以将决策边界投影到较低维度的子空间上(如上图中的黑线)。 是否可以使用公式来计算原始(较高)维度中的决策边界?如果是,那么此公式需要哪些输入?

3
证明矩生成函数唯一确定概率分布
Wackerly等人的文字指出该定理“让和分别表示随机变量X和Y的矩产生函数。如果两个矩产生函数都存在并且对于所有t值,则X和Y具有相同的概率分布。” 没有证据表明其超出了本文的范围。Scheaffer Young 在没有证明的情况下也具有相同的定理。我没有Casella,但是Google图书搜索似乎没有在其中找到定理。mx(t)mx(t)m_x(t)my(t)my(t)m_y(t)mx(t)=my(t)mx(t)=my(t)m_x(t) = m_y(t) Gut的文本似乎具有证明的轮廓,但是没有提及“众所周知的结果”,还需要知道另一个未提供证明的结果。 有谁知道谁最初证明了这一点,并且该证明是否可以在任何地方在线获得?否则,将如何填写这一证明的细节? 如果我不被问到这不是一个家庭作业问题,但我可以想象这可能是某人的家庭作业。我根据Wackerly的文字选了一个课程序列,一段时间以来,我一直在想知道这个证明。所以我认为是时候问了。

2
功能工程教程
众所周知,特征工程对于机器学习极为重要,但是我发现与此领域相关的材料很少。我参加了Kaggle的几次比赛,并认为在某些情况下,好的功能甚至比好的分类器更重要。有谁知道关于功能工程的任何教程,或者这是纯粹的经验?

3
为什么β分布密度函数为-1?
Beta分布出现在两个参数设置下(或在此处) f(x)∝xα(1−x)βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} 或似乎更常用的一种 f(x)∝xα−1(1−x)β−1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} 但是,为什么第二个公式中确切有“ ”呢?−1−1-1 第一个公式在直观上似乎更直接对应于二项式分布 g (k )∝ p k(1 - p )n - kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} 但是从的角度来看“可见”ppp。这在beta二项式模型中尤其明显,其中可理解为先前的成功次数,是先前的失败次数。αα\alphaββ\beta 那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果? 如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。


9
参考要求:广义线性模型
我正在寻找有关广义线性模型的入门级到中级水平的书。理想情况下,除了模型背后的理论外,我希望它包括R或另一种编程语言的应用程序和示例-我听说SAS也是一种流行的选择。我打算自己研究它,因此如果它为自己的练习提供了答案,将会有所帮助。 您可以假设我参加了为期一年的传统微积分和概率论课程。我还熟悉回归分析的基础。

6
很好地介绍了各种熵
我正在寻找一本书或在线资源,以解释不同种类的熵,例如样本熵和香农熵以及它们的优缺点。有人可以指出我正确的方向吗?


3
结构计量经济学入门课
近年来,与简化形式的计量经济学相比,计量经济学的结构方法变得越来越流行。这涉及理论经济模型和统计数据的紧密结合,以便估算感兴趣的参数。以我们使用数据和统计方法的方式强加理论结构的目的是提供指导,有时甚至可以发现简化形式方法不容易估计的参数。即使对于非计量经济学家来说,这也可能是有趣的,因为模拟和抽样可能是结构估计中的重要组成部分,并且该技术也很适用于其他社会科学。 迄今为止,计量经济学的这一分支作为统计的分支似乎没有任何入门教科书。我只发现了更高级的资料,例如Choo和Shum(2013)的《结构计量经济学模型》或Reiss和Wolak的调查章节。 有人可以将我引向一组讲座或什至一本书(我只是还没有找到)来介绍结构计量经济学吗?理想情况下,这将基于具有不同方法的示例,包括代码或有关如何复制这些示例以更好理解的指南。 我知道一些研究论文,尤其是在工业组织中 国家依存模型(Rust,1987) 需求估算(Berry,1994; Berry,Levinson和Pakes,1995) 生产率估算(Olley和Pakes,1996) 估计市场力量(Nevo,2005; Sovinsky,2008) 但其中大多数很难遵循。因此,如果有人知道更温和的介绍,这将对您大有帮助。

4
关于统计的数学基础的良好资源(在线或书籍)
在我提出问题之前,让我给您一些有关统计知识的背景知识,以便您对我正在寻找的资源类型有更好的了解。 我是心理学的研究生,因此,我几乎每天都使用统计数据。到目前为止,我已经熟悉了各种各样的技术,主要是因为它们是在通用结构方程建模框架中实现的。但是,我的培训是使用这些技术和结果的解释-我对这些技术的正式数学基础了解不多。 但是,越来越多的我不得不从统计数据中正确地阅读论文。我发现这些论文经常假定我对数学概念不了解,例如线性代数。因此,我变得坚信,如果我希望做的不仅仅是盲目使用所教的工具,那对我了解一些统计学的数学基础将是有用的。 因此,我有两个相关的问题: 如果我想重新掌握统计学的数学基础,哪种数学技术对我有用?我经常遇到线性代数,而且我相信对概率论的学习将是有用的,但是还有其他数学领域对我来说是有用的吗? 作为想进一步了解统计学的数学基础的人,您可以向我推荐哪些资源(在线或书本形式)?

12
介绍统计数据分析的最佳书籍?
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 我买了这本书: 如何衡量一切:在企业中发现无形资产的价值 和 头先数据分析:大数,统计和好的决策学习者指南 您还会推荐哪些其他书籍?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.