使用平均长度和平均体重来计算平均BMI?


13

使用给定人口的平均长度()和平均体重())计算该人口的平均身体质量指数()是否有效?hwBMI=wh2


问题不是那么抽象(按照@JoeTaxpayer的评论):典型的实际BMI(15.0-30.0)已经已经四舍五入为1dp,因此,如果由于使用均值比率而导致的平均BMI误差为〜0.05, -0.1在数学上可以忽略不计(<1%);适用于(高度,重量)的大多数实际分布。我们不是在谈论劳雷尔和哈迪...
smci

Answers:


18

E(Y/X2)=E(Y)/E(X)2

但是,对于一组相当现实的双变量身高和体重数据,看起来影响很小。

例如,考虑Brainard和Burmaster(1992)[1]中美国成年男性身高和体重的模型;该模型是身高和对数(体重)的二元法线,非常适合身高体重数据,并易于获得逼真的模拟。一个适合女性的好的模型要复杂一些,但是我不认为它会对BMI近似值的质量产生太大的影响。我只打算做男性,因为一个非常简单的模型非常好。

h¯/w¯2

从改变参数的影响来看,使用偏向变量均值估计器对女性的影响看起来可能会稍大一些,但仍不足以使它成为一个大问题。

理想情况下,应该检查与您想要使用它的情况更接近的东西,但是它可能会非常不错。

因此,对于典型情况,在实践中似乎不太可能成为大问题。

[1]:Brainard,J.和Burmaster,DE(1992),
“美国男女身高和体重的双变量分布”,《
风险分析》,第一卷。第12号,第267-275页


10

这不是完全正确的,但通常不会产生很大的变化。

例如,假设您的体重为80、90和100kg,分别为1.7、1.8和1.9m。那么BMI是27.68、27.78和27.70。BMI的平均值为27.72。如果您通过体重和身高的平均值来计算BMI,您会得到27.78,虽然略有不同,但通常不会产生太大的差异。


感谢您的回答!因此,这意味着这种计算方法可能不适用于任何类型的统计分析,对吗?
苏菲·米歇尔

2
老实说,我不会走得太远。无论如何,统计数据正在处理嘈杂的数据,而在测量身高或体重时略有不精确将使我们在这里的差异相形见war。我建议您使用您正在考虑使用的数据沿着这些思路进行模拟,然后考虑这些微小差异是否确实会对您的统计分析产生影响。
斯蒂芬·科拉萨

1
“如果通过体重和身高的平均值来计算BMI,您将获得27.78”,但这等于BMI的最大值!对我来说,获得最大值而不是平均值似乎是一个很大的差异。
累积

@积累-史蒂芬(Stephan)的观点不成立,但数字的选择并不能很好地说明情况。“正常”的BMI为18.5至24.9。该示例中的3个BMI的范围从低到1。此数据的1/2%差异是噪声。一个5'8"人的BMI从27.4上升至27.5为他的体重从180上升到181一磅是之前还是让上规模后饮用的水高脚杯之间的区别。
JTP -道歉,莫妮卡

@JoeTaxpayer:我想您的意思是,典型的BMI(15.0-30.0)已经已经四舍五入到1dp,因此,如果由于使用均值比率导致的平均BMI误差小于0.05,则在数学上可以忽略不计。正确?
smci

3

尽管我同意其他答案,但这种方法可能会近似于平均BMI,但我想指出,这只是一个近似值。

实际上,我倾向于说,你应该使用你所描述的方法,因为它仅仅是不准确的。计算每个人的BMI,然后取其平均值,给您真正的平均BMI,这是微不足道的。

在这里,我说明了两个极端,重量和长度的平均值保持不变,但平均BMI实际上不同:

使用以下(matlab)代码:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

我们得到: mean_bmi2

如果简单地对长度进行重新排序,我们将得到不同的均值BMI,而均值(权重)/均值(长度^ 2)保持不变:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

卑鄙的bmi

同样,使用真实数据,您的方法可能会近似于真实的平均BMI,但是为什么要使用不太准确的方法呢?

超出问题范围:可视化数据始终是一个好主意,这样您就可以实际看到分布。例如,如果您注意到某些集群,则还可以考虑为这些集群获取单独的均值(例如,在我的示例中分别为前3个人和后3个人)


2
“计算每个人的BMI,然后取其平均值,给您真正的平均BMI,这很简单。” 是的,如果您有原始数据。如果您所拥有的只是人口的摘要统计信息,例如平均身高和体重,则可以从中得出“人口BMI”,这是您所能做到的最好的事情,而这个近似值的有效程度是非常有效的问题。
斯蒂芬·科拉萨

1
+1如果可以得到相同的汇总原始数据的答案,则不要汇总汇总。有答案和评论在这种情况下几乎没有/没有/苗条/可以忽略不计,但不要这样做。学习并使用有关数据分析的健康做法,以正确的方式进行。
斯蒂安·伊特维克
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.