Questions tagged «median»

中位数是数据或概率分布所占的一半以下的值-当样本数量为奇数时,中位数是有序样本的“中间”值。

1
中位数中位数计算
我做了很多房地产报告,经​​常会报告中位数价格,尤其是NAR(全国房地产经纪人协会)的报告。尽我所能说,他们只能得到每个地区的房地产价格中位数。我的问题是,鉴于数据限制,应如何计算国家中位数?作为中位数的中位数,是中位数的简单平均值,还是中位数的加权平均值或完全不同的东西?第二,这些估计的有效性如何?我知道NAR并没有获得总交易额表,那么在国家层面上仍可以估算中位数的合理准确代表吗?我特别要问,因为区域密度和价格以及市场差异很大。
13 median 

2
在线估计四分位数而不存储观测值
我需要在不存储观测值的情况下,根据大量数据实时计算四分位数(Q1,中位数和Q3)。我首先尝试了P平方算法(Jain / Chlamtac),但对它却不满意(CPU使用量过多,至少对于我的数据集的精度没有把握)。 我现在使用FAME算法(Feldman / Shavitt)动态估算中值,然后尝试推导该算法以计算Q1和Q3: M = Q1 = Q3 = first data value step =step_Q1 = step_Q3 = a small value for each new data : # update median M if M > data: M = M - step elif M < data: M = M + step …



4
假设检验用于两个以上样本之间的中位数差异
题 将三组人的测试成绩另存为R中的向量。 set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) 我想知道这些群体之间的中位数是否存在显着差异。我知道我可以使用Wilcoxon测试来测试第1组和第2组。 wilcox.test(group1, group2) 但是,这一次只比较两个组,我想同时比较所有三个组。我想进行统计检验,得出p值为0.05的显着性水平。有人可以帮忙吗? 编辑#1-情绪中位数测试 按照用户Hibernating的建议答案,我尝试了Mood的中位数测试。 median.test <- function(x, y){ z <- c(x, y) g <- rep(1:2, c(length(x), length(y))) m …

3
中位数在[Mode-Mean]之外的反例
此文章是我上面的联赛,但它谈论,我很感兴趣,之间的平均,模式和中位数的关系的话题。它说 : 普遍认为,单峰分布的中值“通常”在均值和众数之间。但是,并非总是如此... 我的问题:有人可以提供中位数在[众数,均值]区间之外的连续单峰(理想情况下简单)分布的示例吗?例如的分布mode < mean < median。 ===编辑======= Glen_b和Francis已经有了很好的答案,但是我意识到我真正感兴趣的是一个示例,其中众数<均值<中位数或中位数<均值<模式(这两个中位数都在[众数,均值]之外,而中位数是与模式均值“在同一侧”(即高于或低于模式)。我可以接受这里的答案是一个新问题,或者有人可以在这里直接提出解决方案?
11 mean  median  mode 

2
为什么报告中位数的置信区间如此罕见?
为什么发现应用科学论文中报道的置信区间如此罕见?我主要从事计算机科学方面的工作,但经常阅读(社会)心理学,社会学和城市规划方面的论文。我不记得曾经看到过报告中位数的CI。 同时,在研究置信区间等时,对我来说很明显,在所有情况下,中位数是一个人的数据的更好描述者,这是应该给出的估计值。 是否有任何理论上的原因导致为什么不常见中位数的CI?

1
哪个收敛速度更快,平均值或中位数?
如果我从N(0,1)绘制iid变量,那么均值或中位数收敛得更快吗?快多少? 更具体地说,令是从N(0,1)提取的iid变量序列。定义和为。或哪个收敛到0更快?x1,x2,…x1,x2,…x_1, x_2, \ldots x¯n=1n∑ni=1xix¯n=1n∑i=1nxi\bar{x}_n = \frac{1}{n}\sum_{i=1}^n x_ix~nx~n\tilde{x}_n{x1,x2,…xn}{x1,x2,…xn}\{x_1, x_2, \ldots x_n\}{x¯n}{x¯n}\{\bar{x}_n\}{x~n}{x~n}\{\tilde{x}_n\} 为了具体说明更快收敛的含义:是否存在?如果是这样,那是什么?limn→∞Var(X¯n)/Var(X~n)limn→∞Var(X¯n)/Var(X~n)\lim_{n \to \infty} Var(\bar{X}_n)/Var(\tilde{X}_n)

3
平均数
我正在处理高度偏斜的数据,因此我使用中位数而不是均值来概括中心趋势。我想测量分散度虽然我经常看到人们报告平均值标准偏差±±\pm或中值四分位数±±\pm以总结中心趋势,但报告中值中值绝对分散度(MAD)±±\pm 是否可以?这种方法是否存在潜在问题? 与报告上下四分位数相比,我会发现这种方法更加紧凑和直观,尤其是在充满数字的大表中。

1
使用中位数和图形表示来报告错误吗?
我已经对论文数据进行了广泛的测试,从参数方差分析和t检验到非参数Kruskal-Wallis检验和Mann-Whitneys检验,以及经过秩转换的2向方差分析和带有二进制的GzLM,泊松和比例数据。现在,当我在结果中写下所有内容时,我需要报告所有内容。 我已经在这里问过如何报告比例数据的不对称置信区间。我知道标准偏差,标准误差或置信区间适用于均值,如果我的所有测试都很好地参数化,这就是我要报告的结果。但是,对于我的非参数测试,我应该报告中位数而不是平均值吗?如果是这样,我将报告什么错误? 与此相关的是如何最好地以图形方式显示非参数测试结果。由于我在类别中主要包含连续或间隔数据,因此通常使用条形图,条形图的顶部是平均值,误差条形图显示95%CI。对于NP测试,我是否仍可以使用条形图,但是条形的顶部代表中位数吗? 感谢您的建议!

1
为什么中位数的95%CI应该是?
在各种来源中(例如参见此处),给出了以下中位数的置信区间的公式(尤其是在箱须图上画凹口的目的): 95% CImedian=Median±1.57×IQRN−−√95% CImedian=Median±1.57×IQRN 95\%\ CI_{\rm median} = {\rm Median} \pm \frac{1.57\times IQR}{\sqrt{N}} 魔法常数使我发疯,我无法弄清楚它是如何获得的。各种近似值(例如,假设我们的分布是高斯分布且大)都没有任何线索-我得到的常数值不同。1.571.571.57NNN

1
箱形图刻痕与Tukey-Kramer间隔
来自“ R”中箱形图的“缺口” 帮助文档(或原始文本)给出以下内容: 如果两个地块的凹口不重叠,这就是两个中间值不同的“有力证据”(Chambers等,1983,第62页)。有关使用的计算,请参见boxplot.stats。 并且“ boxplot.stats ”给出以下内容: 槽口(如果需要)扩展到+/- 1.58 IQR / sqrt(n)。这似乎是基于与McGill等人(1978年,第16页)中Chambers等人(1983,第62页)中1.57公式相同的计算。它们基于中位数的渐近正态性和所比较的两个中位数的大致相等的样本大小,并且据说对样本的基本分布不敏感。这个想法似乎是为两个中位数的差异给出大约95%的置信区间。 现在,我更加熟悉使用Tukey-Kramer测试的JMP版本比较列的平均值。 JMP文档提供了以下内容: 显示针对所有均值之间差异的测试。这是Tukey或Tukey-Kramer HSD(诚实的显着差异)测试。(Tukey 1953,Kramer 1956)。如果样本大小相同,则此测试为精确的alpha级测试;如果样本大小不同,则为保守测试(Hayter 1984)。 问题:两种方法之间的联系的本质是什么?有没有办法将一个变成另一个? 看起来有人正在寻找中位数的大约95%CI,然后确定是否存在重叠;另一个是“精确阿尔法测试”(我的样本大小相同),用于确定两组样本的中位数是否在彼此的合理范围内。 我参考了软件包,但是我对逻辑背后的数学感兴趣。

3
有计算中位数的公式吗?
是否有一个等效的均值公式: 米Ë 一个Ñ =1个ñ∑我= 1ñX一世米Ë一个ñ=1个ñ∑一世=1个ñX一世\begin{equation} \mathrm{mean} = \cfrac{1}{N} \sum_{i=1}^{N} X_i \end{equation} 中位数?

5
用Layman的术语解释均值,中位数,众数
您将如何解释数字列表的均值,中位数和众数的概念,以及为什么它们对仅具有基本算术技能的人很重要?更不用说偏度,CLT,集中趋势,其统计属性等了。 我已经向某人解释说,这只是“汇总”数字列表的一种快速而肮脏的方法。但是回头看,这很难说明。 有什么想法或现实世界的例子吗?

1
中位数是“度量”属性还是“拓扑”属性?
对于术语的轻微滥用,我深表歉意。我希望我下面的意思会清楚。 考虑随机变量。均值和中位数都可以用最优性标准来表征:均值是使最小的数字,而中位数是使。从这个角度来看,平均值和中位数之间的差异是用于评估偏差,平方或绝对值的“度量”的选择。XXXμμ\muE((X- μ )2)Ë((X-μ)2)\mathrm E((X - \mu)^2)E( | X−μ|)E(|X−μ|)\mathrm E(|X - \mu|) 另一方面,中位数是(假定绝对连续性)的数字,即该定义仅取决于对值进行排序的能力,并且与它们有多少不同。这样的结果是,对于每个严格增加的函数,,这意味着它是“拓扑”的在“类似橡胶”的变换下保持不变。Pr(X≤ μ)=12Pr(X≤μ)=1个2\mathrm{Pr}(X \leq \mu) = \frac12XXXF(x)F(X)f(x)米Ë ð 我一个Ñ(f(X)) =f(米Ë ð 我一个Ñ(X))米Ëd一世一个ñ(F(X))=F(米Ëd一世一个ñ(X))\mathrm{median}(f(X)) = f(\mathrm{median}(X)) 现在,我已经完成了数学运算,并且我知道从最佳准则开始,我可以得出 -quantile,因此两者都描述相同的事物。但是我仍然感到困惑,因为我的直觉告诉我,依赖于“度量”的某些事物不能导致“拓扑”属性。1个21个2\frac12 有人可以为我解决这个难题吗?
10 mean  median 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.