Questions tagged «mean»

随机变量的期望值;或样品的位置测量。

2
逻辑回归中的过度分散
我正在尝试处理逻辑回归中过度分散的概念。我已经读到过度分散是指观察到的响应变量方差大于二项式分布的预期值。 但是,如果一个二项式变量只能具有两个值(1/0),那么它如何具有均值和方差? 我可以通过x次数的Bernoulli试验来计算成功的均值和方差。但是我无法将只能具有两个值的变量的均值和方差的概念笼罩在脑海中。 任何人都可以提供以下内容的直观概述: 只能有两个值的变量的均值和方差的概念 只能有两个值的变量中的超分散概念



3
不确定性的几种测量的标准偏差
我有两个2个小时的GPS数据,采样率为1 Hz(7200次测量)。中的数据形式给出,其中Ñ σ是测量不确定性。(X,Xσ,Y,Yσ,Z,Zσ)(X,Xσ,Y,Yσ,Z,Zσ)(X, X_\sigma, Y, Y_\sigma, Z, Z_\sigma)ñσNσN_\sigma 当我取所有测量值的平均值(例如,这两个小时的平均Z值)时,其标准偏差是多少?我当然可以从Z值计算出标准偏差,但是后来我忽略了已知的测量不确定性这一事实... 编辑:数据全部来自同一测站,并且每秒重新测量所有坐标。由于卫星星座等原因,每次测量都具有不同的不确定性。我的分析目的是找出由于外部事件(例如地震)引起的位移。我想取地震前7200次测量的平均值(2h),取地震后2h的另一个平均值,然后计算所得的差值(例如,高度)。为了指定此差异的标准偏差,我需要知道两种方法的标准偏差。




3
如何解释修整百分比与修整平均值的关系图?
对于作业问题的一部分,我被要求通过删除最小和最大的观测值来计算数据集的修整平均值,并解释结果。修整后的平均值低于未修整的平均值。 我的解释是,这是因为基础分布正偏,所以左尾比右尾更密。由于这种偏斜,删除高基准数据会比平均低基准数据向下拖累平均值下降更多,因为从非正式的角度来说,还有更多的低数据在“等待取代”。(这合理吗?) 然后,我开始怀疑修整百分比如何对其产生影响,因此我针对各种计算了修整后的平均值。我得到了一个有趣的抛物线形状: x¯tr(k)x¯tr⁡(k)\bar x_{\operatorname{tr}(k)}k=1/n,2/n,…,(n2−1)/nk=1/n,2/n,…,(n2−1)/nk = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n 我不太确定该如何解释。从直觉上看,似乎曲线图的斜率应该(与中位数的数据点内的分布部分的负偏度成正比)。(这个假设确实可以验证我的数据,但是我只有,所以我不太有把握。)kkkn=11n=11n = 11 这种类型的图是否有名称,还是常用的?我们可以从该图中收集哪些信息?有标准解释吗? 作为参考,数据为:4、5、5、6、11、17、18、23、33、35、80。



4
假设检验用于两个以上样本之间的中位数差异
题 将三组人的测试成绩另存为R中的向量。 set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) 我想知道这些群体之间的中位数是否存在显着差异。我知道我可以使用Wilcoxon测试来测试第1组和第2组。 wilcox.test(group1, group2) 但是,这一次只比较两个组,我想同时比较所有三个组。我想进行统计检验,得出p值为0.05的显着性水平。有人可以帮忙吗? 编辑#1-情绪中位数测试 按照用户Hibernating的建议答案,我尝试了Mood的中位数测试。 median.test <- function(x, y){ z <- c(x, y) g <- rep(1:2, c(length(x), length(y))) m …

3
中位数在[Mode-Mean]之外的反例
此文章是我上面的联赛,但它谈论,我很感兴趣,之间的平均,模式和中位数的关系的话题。它说 : 普遍认为,单峰分布的中值“通常”在均值和众数之间。但是,并非总是如此... 我的问题:有人可以提供中位数在[众数,均值]区间之外的连续单峰(理想情况下简单)分布的示例吗?例如的分布mode < mean < median。 ===编辑======= Glen_b和Francis已经有了很好的答案,但是我意识到我真正感兴趣的是一个示例,其中众数<均值<中位数或中位数<均值<模式(这两个中位数都在[众数,均值]之外,而中位数是与模式均值“在同一侧”(即高于或低于模式)。我可以接受这里的答案是一个新问题,或者有人可以在这里直接提出解决方案?
11 mean  median  mode 

3
绘制结果仅具有平均值和标准偏差
我正在尝试在此表中的观察值和召回得分的标准差的可视化中绘制一个合适的图: 召回控制意思37标清8实验性意思21标清6控制实验性意思标清意思标清召回378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ & \text{Mean} & \text{SD} &\text{Mean} &\text{SD} \\ \hline \text{Recall} & 37 & 8 & 21 & 6 \\ \hline \end{array} 最好的方法是什么?条形图是一个好方法吗?在这种情况下如何说明标准偏差?

1
哪个收敛速度更快,平均值或中位数?
如果我从N(0,1)绘制iid变量,那么均值或中位数收敛得更快吗?快多少? 更具体地说,令是从N(0,1)提取的iid变量序列。定义和为。或哪个收敛到0更快?x1,x2,…x1,x2,…x_1, x_2, \ldots x¯n=1n∑ni=1xix¯n=1n∑i=1nxi\bar{x}_n = \frac{1}{n}\sum_{i=1}^n x_ix~nx~n\tilde{x}_n{x1,x2,…xn}{x1,x2,…xn}\{x_1, x_2, \ldots x_n\}{x¯n}{x¯n}\{\bar{x}_n\}{x~n}{x~n}\{\tilde{x}_n\} 为了具体说明更快收敛的含义:是否存在?如果是这样,那是什么?limn→∞Var(X¯n)/Var(X~n)limn→∞Var(X¯n)/Var(X~n)\lim_{n \to \infty} Var(\bar{X}_n)/Var(\tilde{X}_n)

1
显示有序数据-均值,中位数和均值等级
我有一些顺序数据不是正态分布的,所以我决定使用Mann-Whitney U检验进行非参数检验。我正在寻找七个分数的组间差异-每个主题的分数分别为0、1、2或3。我很难弄清楚如何显示我的数据! 如果我使用中位数(和中位数的IQR)显示数据,那么根本就不清楚差异在哪里,因为在大多数情况下,中位数落在0或1上。因此,尽管Mann-Whitney U检验显示出显着差异,桌子看起来没意思。 我也可以使用手段呈现数据。那里有一些科学论文说,您可以使用具有序数数据的均值,但是不能对分数之间的差异做出相同类型的假设(例如0和1之间的差异与1和1之间的差异不相同) 2)。尽管表中的数字很好地说明了我使用它们时的故事,但使用方法会引起一些争议。 第三种选择是使用SPSS在曼恩·惠特尼(Mann-Whitney)输出中给我的平均排名。平均等级是各组之间正在比较的,所以也许我应该使用那些?我唯一遇到的问题是,平均排名对实际数据没有任何意义(例如,使用平均等级,我看不到对象更接近3,而控件更接近1。) 最后的选择是在将得分分为两组(低分为0和1,高分为2和3)后,比较受试者和对照者进行卡方分析。但是,当我这样做时,差异并不明显(可能是由于多种原因)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.