Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。

2
我可以在元回归中将效果大小作为自变量包括在内吗?
我的问题是,是否可以在元回归中将效应大小用作因变量,将另一个效应大小用作自变量?XXXYYY 例如,我对运动对饮酒问题的影响进行了荟萃分析,发现了显着的结果和高度异质性。我想做一个元回归,并使用这些干预措施对焦虑的影响大小作为自变量,并以饮酒问题的影响大小作为因变量(假设每项研究都评估了焦虑和饮酒问题,并且我计算了效果大小为对冲的)。ggg 你能理解这个吗?

5
关于文本挖掘的好书?
嗨,我想知道是否有一些有关文本挖掘和分类的好书,还有一些案例研究?如果不是这样的话,一些公众可以获取的论文/期刊就可以了。如果他们用R更好地说明自己的例子。我不是在寻找逐步的手册,而是要说明一些针对各种问题的各种文本挖掘方法的利弊。

2
纯粹数学家的应用概率介绍?
我拥有纯数学(测量理论,泛函分析,算子代数等)的研究生背景。我的工作还需要概率论方面的一些知识(从基本原理到机器学习技术)。 我的问题是:有人可以提供一些规范的阅读和参考资料: 概率论的完备介绍 不要回避度量理论方法和证明 重点强调应用技术。 基本上,我想要一本书,该书将教我面向纯数学家的应用概率论。从概率论的基本公理开始,并以严格的数学方法介绍应用的概念。 根据评论,我将详细说明我需要的东西。我正在进行基础到高级的数据挖掘。Logistic回归,决策树,基本统计和概率(方差,标准差,可能性,概率,可能性等),有监督和无监督的机器学习(主要是聚类(K均值,层次结构,SVM))。 考虑到以上几点,我希望有一本书从头开始。定义概率测度,然后还显示这些测度如何导致基本求和概率(直觉上,我知道是通过离散集的积分发生的)。从那里开始,它可能会进入:贝叶斯(Mares Chains),马尔可夫链(Markov Chains)...。矿业)。 是否有这样的书或参考书? 谢谢! PS-我意识到这在范围上类似于这个问题。但是,我在寻找概率论而不是统计学(就像两个领域一样)。

3
数据挖掘者实验设计课程
我是从事数据挖掘的计算机科学家。可以肯定地说,计算机科学家在进行系统的实验设计和评估方面相当差劲-使用p值和置信度估计被认为是高级的:)。 我想知道是否有好的课程/材料可以教计算机科学家有关好的实验设计的知识。为了更加具体,我将添加以下信息: 本课程应针对可以假定对概率有合理理解但统计学背景有限的研究生。 本课程应侧重于“不受控制的非自然环境”中的实验设计:换句话说,既没有潜在的物理基础事实,也没有控制数据收集过程的方式(与人类受试者一样)。当然,一门好的课程将侧重于基本原理,但是它应该以一种重要的方式来应对这种情况。 计算元素将是奖励,但不是强制性的。我们处理大量数据,但可以根据需要自己解决计算问题。

2
参考为
@Erik P.在回答我的上一个问题时,给出了表达式 其中Var[s2]=σ4(2n−1+κn),Var[s2]=σ4(2n−1+κn), \mathrm{Var}[s^2]=\sigma^4 \left(\frac{2}{n-1} + \frac{\kappa}{n}\right) \>, 是分布的峰度。给出了有关样本方差分布的Wikipedia条目的引用,但是Wikipedia页面上显示“需要引用”。κκ\kappa 我的主要问题是,此公式是否有参考?推导是否“琐碎”?如果是的话,可以在教科书中找到它吗?(@Erik P.在数学统计和数据分析中找不到,在Casella和Berger的统计推断中也找不到。尽管涵盖了该主题。 拥有教科书参考书会很好,但是拥有(主要)参考书会更有用。 (一个相关的问题是:样本分布与未知分布的方差分布是什么?) 更新:@cardinal指出了另一个方程math.SE: 其中,μ4是第四中心矩。Var(S2)=μ4n−σ4(n−3)n(n−1)Var(S2)=μ4n−σ4(n−3)n(n−1) \mathrm{Var}(S^2)={\mu_4\over n}-{\sigma^4\,(n-3)\over n\,(n-1)} μ4μ4\mu_4 是否可以通过某种方式重新排列方程式并解决这两个问题,还是标题中的方程式错误?

2
将Adaboost与SVM一起使用进行分类
我知道Adaboost会尝试使用一组弱分类器的线性组合来生成强分类器。 但是,我读过一些论文,建议Adaboost和SVM在某些条件和情况下可以协调工作(即使SVM是强大的分类器)。 从体系结构和编程的角度看,我无法把握它们如何结合使用。我读过许多论文(也许是错误的论文),但并没有清楚地解释它们如何协同工作。 有人可以阐明他们如何结合使用以进行有效分类吗?指向一些论文/文章/期刊的指针也将不胜感激。

2
是否值得在引用的Wiki StatProb.com上发布?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 7个月前关闭。 背景 我从对Andrew Gelman的Blog的评论中了解到StatProb.com。 根据该网站,StatProb为: StatProb:由统计与概率协会赞助的百科全书结合了传统Wiki(快速和最新发布,用户生成的开发,超链接和保存的历史记录)与传统发布(质量保证,审阅,作者信誉)的优势,以及结构化的信息显示)。所有贡献均已由领先的统计协会确定的编辑委员会批准;编辑委员会成员列在“关于”页面上。 我不是统计学家,但是我使用统计学,因此该站点似乎为我提供了机会,尽管我可能将其发布为附录或将其发布在网站上,但这些材料虽然可能对其他人有用,但可能不会发布。该选项之所以具有吸引力,是因为审查过程将增强我对我使用的方法的信心,并使其在公共领域具有一定的信誉。 尽管得到了主要统计和概率协会的支持,该站点仍未起飞。确实,一位博主问“ RIP StatProb?” 而且捐款的频率一直在下降。 题: 通过StatProb.com进行发布值得付出努力吗? 更新: 截至今天(2012-02-01),最近的贡献是2011-05-04 ; 最近编辑2011-06。因此,今天的问题看上去比最初提出问题时的吸引力要小。

6
具有背包约束的统计资料库
假设您有200美元的资金来建立(非常)小的统计书籍图书馆。您会选择什么?您可能会假设亚马逊免费送货,并且互联网上任何可免费获取的文本都是公平的游戏,但假设每页打印收取5美分的费用。 (我的灵感来自多佛尔的书,但是他们提供的大多数产品似乎有点过时了)。

4
关于临床试验的好的文字?
我是一名本科统计学专业的学生,​​正在寻找一种对临床试验分析进行良好治疗的方法。文字应涵盖实验设计,阻断,功效分析,拉丁方设计和聚类随机化设计等基础知识。 我具有数学统计和实际分析的本科知识,但是如果有很棒的文章需要更高的统计或分析水平,我可以努力解决。

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
在线参考介绍OLS
我开始研究普通最小二乘(OLS)估计量,但仍处于起步阶段。我已经买了一些关于计量经济学的书,但是我没有在网上找到任何东西。因此,我想知道是否存在一个网站,主页或其他在线资源,它们以详尽的方式解释了最小二乘估计。我正在寻找提供一般介绍或概述的材料。到目前为止,我在互联网上没有发现任何令人难以置信的东西。有人有一些有用的参考吗? 理想的在线参考文献以一种简单的方式解释了OLS的用途。理想情况下,它还提供有关特定主题的示例和更多信息,例如估算器的数学推导,OLS的假设或估算器无偏的数学点。我不是在寻找计量经济学书的pdf文件。

5
Metropolis Hastings算法
我需要研究马尔可夫链蒙特卡罗方法,更具体地说,我需要研究Metropolis Hastings算法及其所有类似收敛准则的算法。 谁能给我开一本书,一本论文或一个网站,用简单的术语解释这一论点,却又不琐碎?
11 references  mcmc 

4
非参数统计简介
我过去两年一直在研究统计数据。我所学的几乎所有内容都是关于参数统计的。现在,我想了解更多有关非参数统计的信息。有人可以建议对此领域进行一些简要介绍(也许也可读)吗?

2
费舍尔假人?
简短版: 有没有介绍罗纳德·费舍尔(Ronald Fisher )的统计学著作(论文和书籍),其对象是那些几乎没有统计学背景或没有统计学背景的人? 我想到的是针对非统计学家的“带注释的Fisher读者”之类的东西。 我在下面阐明了这个问题的动机,但是要警告说,它是一个漫长的过程(我不知道如何更简洁地解释它),而且几乎肯定是有争议的,可能是令人讨厌的,甚至是令人发指的。因此,请跳过本篇文章的其余部分,除非您真的认为问题(如上所述)过于简洁而无法进一步澄清。 我自学了很多人认为很困难的许多领域的基础知识(例如线性代数,抽象代数,实数和复数分析,一般拓扑,测度理论等),但是我在自学统计学上的所有努力都失败了。 这样做的原因不是我发现统计数据在技术上很困难(或者比我设法找到的其他领域要困难的多),而是我发现统计数据始终是异类的(如果不是很奇怪的话),远比其他任何东西都重要。我自学的其他领域 慢慢地,我开始怀疑这种怪异的根源大多是历史性的,而且,作为一个从书本而不是从业者社区学习该领域的人(如果我曾接受过统计学方面的正式培训,情况就是如此)。 ),直到我对统计历史有了更多了解之前,我永远不会摆脱这种疏离感。 因此,我读了几本有关统计历史的书,事实上,这在解释我认为是该领域的怪异方面大有作为。但是我仍然有一些方法可以朝这个方向发展。 我从统计历史上的阅读中学到的一件事是,我认为统计中的许多奇异事物的来源是一个人,罗纳德·费舍尔。 实际上,下面的引号1(我最近才发现)非常符合我的认识,即我只有深入研究历史才能开始理解这一领域,并开始关注费舍尔。参考点: 大多数统计概念和理论可以与其历史渊源分开描述。对于“基准概率”的情况,如果没有不必要的神秘化,这是不可行的。 确实,我认为我的直觉虽然是主观的(当然),但并非完全没有根据。费舍尔不仅贡献了统计学中一些最开创性的想法,而且因不理会先前的工作以及对直觉的依赖而臭名昭著(要么提供几乎其他任何人都无法理解的证据,要么完全忽略它们)。此外,他与20世纪上半叶的许多其他重要统计学家有着终生的争执,这些争执似乎在该领域造成了很多混乱和误解。 我从所有这一切得出的结论是,是的,费舍尔对现代统计的贡献确实意义深远,尽管并非所有人都是积极的。 我还得出结论,要真正了解我对统计的异化,我必须至少阅读一些Fisher的原始形式的作品。 但是我发现,费舍尔的作品不辜负其不可渗透的声誉。我试图找到这些文献的指南,但是,不幸的是,我发现的所有内容都是针对受过统计学训练的人员,因此,对于我来说,理解它所要阐明的内容同样困难。 因此,本文开头的问题。 1 Stone,Mervyn(1983),“基准概率”,《统计科学百科全书 》3 81-86。纽约威利。

3
关于信用评分的好书/论文
我正在寻找有关信用评分的书籍的推荐。我对该问题的各个方面都感兴趣,但主要涉及:1)良好的功能。如何建立它们?哪些被证明是好的?2)神经网络。它们在信用评分问题中的应用。3)我选择了神经网络,但是我对其他方法也很感兴趣。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.