Questions tagged «t-distribution»

t是t检验得出的t统计量的分布。仅将此标签用于有关分发的问题;使用[t-test]来回答有关测试的问题。

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
证明OLS模型中的系数服从(nk)自由度的t分布
背景 假设我们有一个普通的最小二乘模型,其中我们的回归模型中有系数, kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} 其中是系数的向量,是由定义的设计矩阵ββ\mathbf{\beta}(k×1)(k×1)(k\times1)XX\mathbf{X} X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} & \dots & & \vdots \\ \vdots & & \ddots & & \vdots \\ 1 & x_{n1} & \dots & \dots & x_{n\;(k-1)} \end{pmatrix} ,错误是IID正常, ϵ∼N(0,σ2I).ϵ∼N(0,σ2I).\mathbf{\epsilon} \sim \mathcal{N}\left(\mathbf{0},\sigma^2 …

4
估计学生t分布的参数
学生t分布参数的最大似然估计是什么?它们是否以封闭形式存在?快速的Google搜索没有给我任何结果。 今天,我对单变量情况很感兴趣,但是可能我将不得不将模型扩展到多个维度。 编辑:我实际上对位置和比例参数最感兴趣。现在,我可以假设自由度参数是固定的,并且可能以后使用某种数字方案来找到最佳值。

3
t平方的总和是多少?
对于中等大小的(例如小于100),让从具有自由度的Student t分布中得出。定义 是否几乎以具有自由度的卡方分布?平方随机变量的总和是否有类似中心极限定理的东西? Ñ Ñ Ť = Σ 1 ≤ 我≤ ķ吨2 我 Ť ķŤ一世tit_iñnnñnnŤ= ∑1 ≤ 我≤ ķŤ2一世T=∑1≤i≤kti2T = \sum_{1\le i \le k} t_i^2ŤTTķkk

3
为什么随着样本数量的增加,t分布变得更正常?
根据Wikipedia,我了解到,当样本是来自正态分布总体的iid观测值时,t分布就是t值的样本分布。但是,我不直观地理解为什么这会导致t分布的形状从肥尾变为几乎完全正常。 我得到的是,如果您从正态分布中进行采样,那么如果您进行大样本采样,它将类似于该分布,但是我不知道为什么它从它的胖尾形状开始。

2
两重分布之差的分布是什么
...为什么? 假设,是独立的随机变量,分别具有均值和方差。我的基本统计书告诉我的分布具有以下属性:X1个X1个X_1μ 1,μ 2 σ 2 1,σ 2 2 X 1 - X 2X2X2X_2μ1个,μ2μ1个,μ2\mu_1,\mu_2σ21个,σ22σ1个2,σ22\sigma^2_1,\sigma^2_2X1个- X2X1个-X2X_1-X_2 Ë(X1个- X2)= μ1个- μ2Ë(X1个-X2)=μ1个-μ2E(X_1-X_2)=\mu_1-\mu_2 Var(X1−X2)=σ21+σ22Var(X1−X2)=σ12+σ22Var(X_1-X_2)=\sigma^2_1 +\sigma^2_2 现在,假设, 是自由度为, t分布。的分布是什么?X 2 n 1 − 1 n 2 − 2 X 1 − X 2X1个X1个X_1X2X2X_2ñ1个− 1ñ1个-1个n_1-1ñ2− 2ñ2-2n_2-2X1个- X2X1个-X2X_1-X_2 这个问题已经过编辑:最初的问题是“两个t分布的差异的自由度是多少?” 。mpiktas已经指出,这是没有道理的,因为不是t分布的,无论近似值(即高df)如何。X1个- X2X1个-X2X_1-X_2X1个,X2X1个,X2X_1,X_2

5
为什么我们不利用t分布来构造比例的置信区间?
要计算具有未知总体标准偏差(sd)的均值的置信区间(CI),我们采用t分布估算总体标准差。值得注意的是,CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}其中。但是因为我们没有总体标准偏差的点估计,所以我们通过近似进行估计,其中σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 相反,对于人口比例,要计算CI,我们近似为其中提供和CI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 我的问题是,为什么我们对人口比例的标准分布感到自满?

1
用给定的MLE模拟随机样本
这个交叉验证问题要求模拟一个以固定金额为条件的样本,使我想起了乔治•卡塞拉(George Casella)提出的一个问题。 f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)对于一个给定的值,有以模拟IID样品一个通用的方法上的MLE的值有条件?θθ\thetaθ(X 1,... ,X Ñ)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) 例如,采用分布,位置参数为,密度为如果我们如何以条件来模拟?在此示例中,没有封闭形式的表达式。T5T5\mathfrak{T}_5μμ\muf(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(x−μ)2/5]−3f(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(x−μ)2/5]−3f(x|\mu)=\dfrac{\Gamma(3)}{\Gamma(1/2)\Gamma(5/2)}\,\left[1+(x-\mu)^2/5\right]^{-3}(X1,…,Xn)∼iidf(x|μ)(X1,…,Xn)∼iidf(x|μ)(X_1,\ldots,X_n)\stackrel{\text{iid}}{\sim} f(x|\mu)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)μ^(X1,…,Xn)=μ0μ^(X1,…,Xn)=μ0\hat{\mu}(X_1,\ldots,X_n)=\mu_0T5T5\mathfrak{T}_5μ^(X1,…,Xn)μ^(X1,…,Xn)\hat{\mu}(X_1,\ldots,X_n)

3
当样本较大时,为什么不使用T分布来估计均值?
基础统计课程通常建议在样本大小n大(通常超过30或50)时使用正态分布来估计总体参数的平均值。学生的T分布用于较小的样本量,以说明样本标准偏差的不确定性。当样本量较大时,样本标准偏差可提供有关总体标准偏差的良好信息,从而可以进行正态分布估计。我明白了。 但是,当您可以准确地获得您的置信区间时,为什么要使用估计呢?无论样本大小如何,如果仅使用T分布可以准确估计出正态分布,那么使用正态分布有什么意义呢?

2
为什么将T分布用于假设检验线性回归系数?
在实践中,通常使用标准的T检验来检验线性回归系数的显着性。计算的机制对我来说很有意义。 为什么可以使用T分布来建模线性回归假设检验中使用的标准检验统计量?我在这里指的是标准测试统计信息: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

3
关于何时使用
我指的是这个视频讲座,用于计算置信区间。但是,我有些困惑。这个家伙正在使用 -statistics进行计算。但是,我认为应该是统计量。我们没有给出总体的真实标准差。我们正在使用样本标准差来估计真实值。zzzttt 那么,为什么他对置信区间而不是对采用正态分布呢?ttt

2
方差不等的t检验中非整数自由度的解释
SPSS t检验程序在比较2个独立均值时报告2次分析,其中1次假设均等方差,1次假设均等方差。假设方差相等时的自由度(df)始终是整数值(等于n-2)。如果未假定等方差,则df为非整数(例如11.467),并且不接近n-2。我正在寻求对用于计算这些非整数df的逻辑和方法的解释。


2
t分布密度函数的直觉
我正在研究学生的t分布,我开始怀疑,如何得出t分布密度函数(来自Wikipedia,http://en.wikipedia.org/wiki/Student%27s_t-distribution): F(t )= Γ (v + 12)v π--√Γ (v2)( 1 + 吨2v)− v + 12f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} 其中是自由度,Γ是伽马函数。这个功能的直觉是什么?我的意思是,如果我查看二项式分布的概率质量函数,这对我来说很有意义。但是t分布密度函数对我完全没有意义...乍一看根本不直观。还是直觉认为它具有钟形曲线并满足我们的需求?vvvΓΓ\Gamma Thnx寻求任何帮助:)

1
PROC Mixed和LME / LMER在R自由度上的区别
注意:这个问题是一个转贴,因为我的上一个问题出于法律原因不得不删除。 在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时,我偶然发现了一些相当混乱的差异。更具体地说,不同测试的自由度在PROC MIXED和之间有所不同lme,我想知道为什么。 从以下数据集(以下给出的R代码)开始: ind:指示进行测量的个人的因子 fac:进行测量的器官 trt:表示治疗的因素 y:一些连续响应变量 这个想法是建立以下简单模型: y ~ trt + (ind):ind作为随机因子 y ~ trt + (fac(ind)):fac嵌套在ind作为随机因子 需要注意的是最后一个模型应引起奇异性,因为只有1的值y对每一个组合ind和fac。 第一模型 在SAS中,我建立以下模型: PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程,R中使用的相同模型nlme应为: > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计,但是在对F的影响进行F检验时trt,它们使用的自由度不同: SAS : Type …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.