Questions tagged «references»

寻求有关特定主题的外部参考文献(书籍,​​论文等)的问题。此外,请始终使用更具体的标签。

3
涵盖数据预处理和异常检测技术的好书
就像标题一样,有谁知道一本很好的,最新的书,该书涵盖了一般的数据预处理,尤其是异常检测技术? 这本书并不需要专心于此,但是它应该详尽地处理上述主题-我对以起点为起点的论文感到满意,并引用了一系列论文,对各种技术的解释必须出现在本书中。这本书本身。 处理丢失数据的技术更可取,但不是必需的...


4
有关因果推理的因果哲学的在线资源
您能推荐一些流行病学家/生物统计学家学习因果关系/因果推理原理的有趣且有用的书籍,文章,论文,在线教程/课程等吗? 我对从Epi和Biostats框架实际进行因果推理非常了解,但是我想了解一些基础知识并推动这项工作。例如,据我了解,休ume首先谈到了可以被解释为反事实的想法。 我基本上没有任何哲学方面的培训或经验,因此我需要相对入门的内容,但是我也对更复杂但重要/基础的文本/作者的建议感兴趣(但请指出它们不是入门性的)。 我希望对于交叉验证而言,这不是太题外话,但我希望你们中的某些人和我以前一样在同一条船上,并且能够共享自己喜欢的资源。




2
参考要求:工作数据科学家的古典统计
我是一位工作数据科学家,在回归,其他机器学习类型算法和编程(数据分析和通用软件开发)方面都有扎实的经验。我一生的大部分时间都集中在构建预测精度模型(在各种业务约束下工作),以及构建数据管道以支持我自己(和其他人)的工作。 我没有接受过统计学方面的正规培训,我的大学教育重点是纯数学。因此,错过了学习许多经典主题的机会,尤其是各种流行的假设检验和推论技巧。 这些主题是否有适合我背景和经验水平的人参考?我可以处理(并欣赏)数学上的严格性,也可以欣赏算法的观点。我倾向于喜欢为读者提供指导性练习的参考书,既有(又有)数学和(或)编程方面的重点。

2
主成分分析可以用于股票价格/非平稳数据吗?
我正在阅读《面向黑客的机器学习》一书中给出的示例。我将首先详细说明示例,然后再讨论我的问题。 范例: 以25个股价的10年为一个数据集。以25股价格运行PCA。将主要成分与道琼斯指数进行比较。观察PC与DJI之间的强烈相似之处! 据我了解,该示例更像是一个玩具,可以帮助像我这样的新手了解PCA工具的有效性! 但是,从另一个消息来源看,我发现股价是不稳定的,以股价运行PCA是荒谬的。我从中阅读的资料完全嘲笑了计算股价的协方差和PCA的想法。 问题: 这个例子如何运作得如此好?股价的PCA与DJI非常接近。该数据是2002-2011年股价的真实数据。 有人可以为我指出一些不错的资源来读取固定/非固定数据吗?我是电脑程序编制员。我有很好的数学背景。但是三年来我都没有做过认真的数学运算。我已经开始重新阅读有关随机漫步等内容的信息。

2
在没有仪器的情况下,关于观测数据的模型我们能说些什么?
过去,我曾在多个领域对发表的论文提出过一些问题,这些领域在观测数据(即非受控实验产生的数据)上使用了回归(以及相关模型,例如面板模型或GLM) ,在许多情况下-但并非总是-随时间推移观察到的数据),但没有尝试引入工具变量。 作为回应,我提出了许多批评(例如,当重要变量可能缺失时描述带有偏见的问题),但是由于此处的其他人无疑比我对这方面的知识要了解得多,我想问一下: 在这种情况下,试图得出有关关系的结论(特别是但不限于因果结论)有哪些主要问题/后果? 在没有仪器的情况下,适合此类模型的研究能做些有用的事情吗? 关于这种建模的问题有哪些好的参考文献(书或论文)(最好具有明显的非技术动机来进行后果分析,因为通常提出问询的人具有各种背景,有些人没有很多统计资料)一篇论文?用仪器讨论预防措施/问题也将很有用。 (有关工具变量的基本参考资料在此处,但是如果您要在其中添加任何内容,那也会有所帮助。) 指向发现和使用工具的良好实践示例的指针将是一个好处,但不是这个问题的中心。 [在出现此类问题时,我可能会在这里指出其他任何好的答案。我可能会添加一两个示例。]

1
参考:逆cdf的尾巴
我几乎可以肯定,我已经在统计数据中看到以下结果,但是我不记得在哪里。 如果是一个正随机变量,并且则到,其中是 cdf 。È(X )&lt; ∞ ε ˚F - 1(1 - ε )→ 0 ε → 0 + ˚F XXXXE(X)&lt;∞E(X)&lt;∞\mathbb{E}(X)<\inftyεF−1(1−ε)→0εF−1(1−ε)→0\varepsilon F^{-1}(1-\varepsilon) \to 0ε→0+ε→0+\varepsilon\to 0^+FFFXXX 通过使用等式并通过考虑在被积体曲线下的区域的处的水平切口,可以很容易地从几何上看出这一点。ε 1 - ˚FE(X)=∫1−FE(X)=∫1−F\mathbb{E}(X)=\int 1-Fεε\varepsilon1−F1−F1-F 您知道此结果的参考以及它是否有名称吗?

1
统计模型符号是否有“标准”?
例如,在BUGS手册或Lee和Wagenmakers即将出版的书(pdf)中,以及在许多其他地方,都使用了一种表示法,在我看来,它非常灵活,因为它可以用于简洁地描述大多数统计模型。这种表示法的示例如下: ÿ一世〜二项式(p一世,n一世)日志(p一世1 − p一世)= b一世b一世〜正常(μp,σp)yi∼Binomial(pi,ni)log⁡(pi1−pi)=bibi∼Normal(μp,σp) y_i \sim \text{Binomial}(p_i,n_i) \\ \log(\frac{p_i}{1 - p_i}) = b_i \\ b_i \sim \text{Normal}(\mu_p,\sigma_p) 它将描述一个没有预测变量但组的分层逻辑模型。描述模型的这种方式似乎工作同样适用于描述频率论者和贝叶斯模型,例如,使这个模型描述完全贝叶斯你只需要添加对先验和。μ p σ pi = 1 … ni=1…ni = 1\dots n μpμp\mu_pσpσp\sigma_p 在某些文章或书中是否详细描述了这种类型的模型符号/形式主义? 如果要使用此符号来编写模型,则有许多不同的处理方式,这对于结合和参考他人的全面指南非常有用。我发现人们在使用这种表示法方面存在一些差异: 您如何称呼分配?例如,我看过等。ñ,N ,范数,正常N,N,Norm,Normal\mathcal{N},\text{N},\text{Norm},\text{Normal} 您如何处理索引?例如,我看过,y_ {i [j]},y_ {j | i}等。 y i [ j ] y j | 一世ÿ我Ĵyijy_{ij}ÿ我[ j …

1
关于最大似然的一致性和渐近正态性的一般性定理
我对有关最大似然估计器的渐近性质的结果有很好的参考价值感兴趣。考虑模型其中是维密度,并且是基于样本来自的MLE其中是的“真”值。我感兴趣的是两个违规行为。˚F Ñ(X | θ )ñ θ Ñ X 1,... ,X Ñ ˚F Ñ(&CenterDot;&| θ 0)θ 0 θ{ ˚Fñ(&CenterDot;&| θ ):θ ∈ Θ ,Ñ ∈ Ñ }{fn(⋅∣θ):θ∈Θ,n∈N}\{f_n(\cdot \mid \theta): \theta \in \Theta, n \in \mathbb N\}Fñ(X | θ )fn(x∣θ)f_n(\mathbf x \mid \theta)ñnnθ^ñθ^n\hat \theta_nX1个,… ,XñX1,…,XnX_1, \ldots, X_nFñ(&CenterDot;&| θ0)fn(⋅∣θ0)f_n(\cdot \mid \theta_0)θ0θ0\theta_0θθ\theta 数据不是iid,因此,关于的Fisher信息的累积速率比慢。 θ …

1
研究逻辑回归的稳健性,以防止违反逻辑线性
我正在执行具有二进制结果(启动和不启动)的逻辑回归。我混合的预测变量都是连续变量或二分变量。 使用Box-Tidwell方法,我的连续预测变量之一可能违反了logit线性的假设。拟合优度统计没有迹象表明拟合是有问题的。 随后,我再次运行回归模型,将原始连续变量替换为:首先是平方根变换,其次是变量的二分形式。 在检查输出时,拟合优度似乎略有提高,但残差成为问题。参数估计值,标准误差和仍然相对相似。在我的假设中,在这三个模型中,数据的解释都没有改变。exp(β)exp⁡(β)\exp(\beta) 因此,就我的结果的实用性和数据解释的意义而言,似乎应该使用原始的连续变量来报告回归模型。 我想知道这一点: Logistic回归何时能抵抗logit假设线性度的潜在违反? 鉴于我上面的示例,在模型中包括原始连续变量似乎可以接受吗? 有什么参考或指南可以推荐何时可以令人满意地接受模型对潜在的logit线性违反的鲁棒性?

3
如何获得总体r平方变化的置信区间
为了简单的示例,假设有两个线性回归模型 模型1有三个预测,x1a,x2b,和x2c 模型2具有从模型1 3个预测和两个附加的预测x2a和x2b 有一个种群回归方程,其中模型1 解释的种群方差为,模型解释为 。模型2解释的种群中的增量方差为ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δ ρ2= ρ2(2 )- ρ2(1 )Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} 我有兴趣获取\ Delta \ rho ^ 2的估计量的标准误差和置信区间Δ ρ2Δρ2\Delta\rho^2。虽然该示例分别涉及3个和2个预测变量,但我的研究兴趣涉及大量不同数量的预测变量(例如5个和30个)。我首先想到的是使用 Δ [R2一dĴ= r2一dj (2 )- - [R2一dĴ (1 )Δradj2=radj(2)2−radj(1)2\Delta r^2_{adj} = r^2_{adj(2)} - r^2_{adj(1)}作为估计量并进行引导,但是我不确定是否会适当的。 问题 是Δ [R2一dĴΔradj2\Delta r^2_{adj}一个合理的估计Δ ρ2Δρ2\Delta \rho^2? 如何获得总体r平方变化的置信区间(即Δ ρ2Δρ2\Delta\rho^2)? 引导Δ ρ2Δρ2\Delta\rho^2是否适合计算置信区间? 任何对模拟或已发表文献的引用也将受到欢迎。 范例程式码 如果有帮助,我在R中创建了一个小的模拟数据集,可用于演示答案: …

4
受限玻尔兹曼机器(RBM)的良好教程
我正在研究受限玻尔兹曼机(RBM),并且在理解有关RBM参数的对数似然计算时遇到一些问题。尽管已经发表了很多有关RBM的研究论文,但没有详细的衍生步骤。在线搜索后,我可以在此文档中找到它们: Fischer,A.和Igel,C.(2012)。受限玻尔兹曼机器概论。在L. Alvarez等人中。(编):CIARP,LNCS 7441,第14–36页,施普林格出版社:柏林-海德堡。(pdf) 但是,该文档的详细信息对我来说太高级了。有人可以指出我关于RBM的良好教程/一组讲义吗? 编辑:@David,令人困惑的部分如下所示(第26页的方程式29): ∂lnL(θ|v)∂wij=−∑hp(h|v)∂E(v,h)∂wij+∑v,hp(v,h)∂E(v,h)∂wij=∑hp(h|v)hivj−∑vp(v)∑hp(h|v)hivj=p(Hi=1|v)vj−∑vp(v)p(Hi=1|v)vj.(29)∂ln⁡L(θ|v)∂wij=−∑hp(h|v)∂E(v,h)∂wij+∑v,hp(v,h)∂E(v,h)∂wij=∑hp(h|v)hivj−∑vp(v)∑hp(h|v)hivj(29)=p(Hi=1|v)vj−∑vp(v)p(Hi=1|v)vj.\begin{align} \frac{\partial\ln\mathcal{L}(\theta|v)}{\partial w_{ij}} &= -\sum_h p(h|v)\frac{\partial E(v, h)}{\partial w_{ij}} + \sum_{v,h} p(v,h)\frac{\partial E(v,h)}{\partial w_{ij}} \\[5pt] &= \sum_h p(h|v)h_iv_j - \sum_v p(v) \sum_h p(h|v)h_iv_j \\[5pt] &= \color{orange}{\boxed{\color{black}{p(H_i=1|v)}}}v_j - \sum_v p(v) \color{orange}{\boxed{\color{black}{p(H_i=1|v)}}}v_j\; . \tag{29} \end{align}
10 references  rbm 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.