将BMI指数定义为体重/身高的统计原因是什么?


10

也许这个问题在医学上是有答案的,但是是否有统计上的原因将BMI指数计算为?为什么不例如仅?我的第一个想法是,它与二次回归有关。体重/身高weight/height2weight/height


真实数据样本(200个体重,身高,年龄和性别的个体):

structure(list(Age = c(18L, 21L, 17L, 20L, 19L, 53L, 27L, 22L, 
19L, 27L, 19L, 20L, 19L, 20L, 42L, 17L, 23L, 20L, 20L, 19L, 20L, 
19L, 19L, 18L, 19L, 15L, 19L, 15L, 19L, 21L, 60L, 19L, 17L, 23L, 
60L, 33L, 24L, 19L, 19L, 22L, 20L, 21L, 19L, 19L, 20L, 18L, 19L, 
20L, 22L, 20L, 20L, 27L, 19L, 22L, 19L, 20L, 20L, 21L, 16L, 19L, 
41L, 54L, 18L, 23L, 19L, 19L, 22L, 18L, 20L, 19L, 25L, 18L, 20L, 
15L, 61L, 19L, 34L, 15L, 19L, 16L, 19L, 18L, 15L, 20L, 20L, 20L, 
20L, 19L, 16L, 37L, 37L, 18L, 20L, 16L, 20L, 36L, 18L, 19L, 19L, 
20L, 18L, 17L, 22L, 17L, 22L, 16L, 24L, 17L, 33L, 17L, 17L, 15L, 
18L, 18L, 16L, 20L, 29L, 24L, 18L, 17L, 18L, 36L, 16L, 17L, 20L, 
16L, 43L, 19L, 18L, 20L, 19L, 18L, 21L, 19L, 20L, 23L, 19L, 19L, 
20L, 24L, 19L, 20L, 38L, 18L, 17L, 19L, 19L, 20L, 20L, 21L, 20L, 
20L, 42L, 17L, 20L, 25L, 20L, 21L, 21L, 22L, 19L, 25L, 19L, 40L, 
25L, 52L, 25L, 21L, 20L, 41L, 34L, 24L, 30L, 21L, 27L, 47L, 21L, 
16L, 31L, 21L, 37L, 20L, 22L, 19L, 20L, 25L, 23L, 20L, 20L, 21L, 
36L, 19L, 21L, 16L, 20L, 18L, 21L, 21L, 18L, 19L), Height = c(180L, 
175L, 178L, 160L, 172L, 172L, 180L, 165L, 160L, 187L, 165L, 176L, 
164L, 155L, 166L, 167L, 171L, 158L, 170L, 182L, 182L, 175L, 197L, 
170L, 165L, 176L, 167L, 170L, 168L, 163L, 155L, 152L, 158L, 165L, 
180L, 187L, 177L, 170L, 178L, 170L, 170L, NA, 188L, 180L, 161L, 
178L, 178L, 165L, 187L, 178L, 168L, 168L, 180L, 192L, 188L, 173L, 
193L, 184L, 167L, 177L, 177L, 160L, 167L, 190L, 187L, 163L, 173L, 
165L, 190L, 178L, 167L, 160L, 169L, 174L, 165L, 176L, 183L, 166L, 
178L, 158L, 180L, 167L, 170L, 170L, 180L, 184L, 170L, 180L, 169L, 
165L, 156L, 166L, 178L, 162L, 178L, 181L, 168L, 185L, 175L, 167L, 
193L, 160L, 171L, 182L, 165L, 174L, 169L, 185L, 173L, 170L, 182L, 
165L, 160L, 158L, 186L, 173L, 168L, 172L, 164L, 185L, 175L, 162L, 
182L, 170L, 187L, 169L, 178L, 189L, 166L, 161L, 180L, 185L, 179L, 
170L, 184L, 180L, 166L, 167L, 178L, 175L, 190L, 178L, 157L, 179L, 
180L, 168L, 164L, 187L, 174L, 176L, 170L, 170L, 168L, 158L, 175L, 
174L, 170L, 173L, 158L, 185L, 170L, 178L, 166L, 176L, 167L, 168L, 
169L, 168L, 178L, 183L, 166L, 165L, 160L, 176L, 186L, 162L, 172L, 
164L, 171L, 175L, 164L, 165L, 160L, 180L, 170L, 180L, 175L, 167L, 
165L, 168L, 176L, 166L, 164L, 165L, 180L, 173L, 168L, 177L, 167L, 
173L), Weight = c(60L, 63L, 70L, 46L, 60L, 68L, 80L, 68L, 55L, 
89L, 55L, 63L, 60L, 44L, 62L, 57L, 59L, 50L, 60L, 65L, 63L, 72L, 
96L, 50L, 55L, 53L, 54L, 49L, 72L, 49L, 75L, 47L, 57L, 70L, 105L, 
85L, 80L, 55L, 67L, 60L, 70L, NA, 76L, 85L, 53L, 69L, 74L, 50L, 
91L, 68L, 55L, 55L, 57L, 80L, 98L, 58L, 85L, 120L, 62L, 63L, 
88L, 80L, 57L, 90L, 83L, 51L, 52L, 65L, 92L, 58L, 76L, 53L, 64L, 
63L, 72L, 68L, 110L, 52L, 68L, 50L, 78L, 57L, 75L, 55L, 75L, 
68L, 60L, 65L, 48L, 56L, 65L, 65L, 88L, 55L, 68L, 74L, 65L, 62L, 
58L, 55L, 84L, 60L, 52L, 92L, 60L, 65L, 50L, 73L, 51L, 60L, 76L, 
48L, 50L, 53L, 63L, 68L, 56L, 68L, 60L, 70L, 65L, 52L, 75L, 65L, 
68L, 63L, 54L, 76L, 60L, 59L, 80L, 74L, 96L, 68L, 72L, 62L, 58L, 
50L, 75L, 70L, 85L, 67L, 65L, 55L, 78L, 58L, 53L, 56L, 72L, 62L, 
60L, 56L, 82L, 70L, 53L, 67L, 58L, 58L, 49L, 90L, 58L, 77L, 55L, 
70L, 64L, 98L, 60L, 60L, 65L, 74L, 99L, 49L, 47L, 75L, 77L, 74L, 
68L, 50L, 66L, 75L, 54L, 60L, 65L, 80L, 90L, 95L, 79L, 57L, 70L, 
60L, 85L, 44L, 58L, 50L, 88L, 60L, 54L, 68L, 56L, 69L), Gender = c(1L, 
1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 
2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
1L, 2L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 
2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 
1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 
2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 
1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 2L, 2L, 1L)), .Names = c("Age", "Height", "Weight", 
"Gender"), row.names = 304:503, class = "data.frame")

5
如今,像这样的公式会从对数(重量)对对数(高度)的线性回归中消失,这(出于生物学和统计的原因)是分析这些数量的更自然的方法。
ub

8
我曾希望用真实的数据来说明这一点。在“体重高度数据”上发现的第一个Google匹配是一个大型的UCLA托管数据集显然是假的!边际分布是完全正态分布的(带有5000个子样本的SW检验几乎总是具有接近1/2的p值):没有异常值,没有低峰度(来自性别混合),没有偏斜(来自年龄混合)。据称这些数据是“用于建立香港……体重指数(BMI)的增长图表”。这是非常可疑。
ub

3
谢谢,但是这些数据可能太有限,无法很好地了解身高和体重的变化。至少需要根据性别和年龄对其进行分类。但是,很明显,更好地分析了身高和体重的对数:它们降低了@ttnphns所指的异方差性,并且还有助于使残差的分布更加对称。有趣的是,原木重量对原木高度的回归给出了的斜率。相比之下几乎正好与克托莱的估计由阿达莫引述。5 / 2 = 2.52.55±0.285/2=2.5
ub

4
比较library(MASS); rlm(log(Weight) ~ log(Height) + cut(Age, 3) + as.factor(Gender), data=y)rlm(Weight ~ Height + cut(Age, 3) + as.factor(Gender), data=y)(和两个配合剧情诊断),看看使用对数的有益的影响:他们确实稳定和对称化的残差。在这两种模型中,性别都很重要,年龄也很重要。与年龄的关系是非线性的。非常有趣的是,第一个模型中的log(height)系数现在约为而不是。(您的数据删除了缺少的值。)我看不到任何交互。2.51.62.5y
ub

3
@whuber,我尝试使用完整样本大小(n = 1336)的代码,对数系数(高度)约为1.77。
Miroslav Sabo

Answers:


13

Eknoyan(2007)撰写的这篇评论远远超出了您可能想知道的关于Quetelet及其发明的体重指数的知识。

简短的说法是,BMI看起来大致呈正态分布,而单独的体重或体重/身高却没有。基于人的成长方式,也有一些第一性原则的论点,而最近的一些工作则试图将其缩小与某些生物力学联系起来。

值得注意的是,BMI的价值备受争议。它确实与肥胖有很好的相关性,但体重过轻/超重/肥胖的临界值与保健结果并不完全匹配。


10
更重要的是,他认为weight/height^3将其解释为密度(从直觉上讲是合理的),但由于您所说的正态分布,因此选择了经典的BMI。
AdamO

4
@AdamO但是,成年人通常只在3个维度中的2个中成长...
James

10

摘自阿道夫·奎特莱(Adolphe Quetelet)的《人与他的才能发展论论》:

如果人在各个维度上均等地增长,那么他在不同年龄时的体重将与身高的立方相同。现在,这不是我们真正观察到的。体重增加较慢,但出生后第一年除外。那么我们刚才指出的比例是经常观察到的。但是在这段时期之后,直到接近青春期,体重的增加几乎与身高的平方成正比。体重的增长在青春期再次变得非常迅速,并且在第二十五年后几乎停止了。通常,当我们假设在开发过程中不同年龄的体重平方是身高的五次方时,我们不会犯太多错误。在支持比重常数时,自然会得出这样的结论:人的横向生长小于垂直方向。

这里

他对肥胖的特征不感兴趣,但对体重和身高之间的关系不感兴趣,因为他对生物特征和钟形曲线非常感兴趣。Quetelet的发现表明BMI在人群中具有大致正态分布。这向他表明他已经找到了“正确的”关系。(有趣的是,只有十年或两年以后的弗朗西斯·高尔顿才开始讨论人口中“身高分布”的问题,并用术语“均值回归”来形容)。

值得注意的是,由于Framingham的研究将BMI作为识别肥胖的一种方法,因此BMI一直是现代生物统计学的祸害。仍然缺乏任何好的肥胖预测指标(及其与健康相关的结局)。腰围与臀围的测量比例是一个有前途的候选人。希望随着超声波变得越来越便宜和更好,医生将使用它们不仅可以识别肥胖症,还可以识别器官中的脂肪沉积和钙化,并据此提出治疗建议。


1
短语“不同年龄的体重平方是身高的五次方” 对我来说是。无论如何,报价与身高不同的成年人无关,而是与发育过程中的个人有关2.5
亨利

1
Quetelet通过观察基于人群的样本推断出个体的发展。我认为他还评论说,平均而言,与2.5指数相关的体重和身高(在所有或大多数年龄范围内)都可以做得很好,但特别是在成年人中,这种关系是二次方的。
AdamO

1
认为腰臀比实际上是Quetelet或他的同时代人考虑的,但也遭到拒绝,因为它也不是正态分布的。我们走了多远
马特·克劳斯

8

如今,BMI主要用于研究腹部内脏脂肪量,可用于研究心血管疾病风险。对于案例分析BMI的充分筛查糖尿病看到第15章http://biostat.mc.vanderbilt.edu/CourseBios330讲义。有几个评估。您会看到更好的身高功效接近2.5,但是比使用身高和体重做得更好。


2
这是一个很好的评论,但似乎并没有解决标准BMI公式背后要求“统计原因”的问题。
ub

1
那是在上面的Quetelet报价中。
Frank Harrell
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.