我必须为非负数,连续数和非负数的健康变量创建5至15岁(仅5,6,7等;没有2.6年这样的分数)的图表(类似于生长图表)。 50-150的范围(只有少数几个值不在此范围内)。我必须创建第90、95和99个百分位曲线,并为这些百分位创建表。样本大小约为8000。
我检查并发现以下可能的方法:
找到分位数,然后使用黄土法从这些分位数中获得平滑曲线。可以通过“ span”参数调整平滑度。
使用LMS(Lambda-Mu-Sigma)方法(例如,在R中使用gamlss或VGAM软件包)。
使用分位数回归。
使用每个年龄组的平均值和SD来估算该年龄段的百分位数,并创建百分位数曲线。
最好的方法是什么?“最好”是指理想的方法,它是创建此类增长曲线的标准方法,并且将为所有人所接受。或者是一种更容易实现的方法,它可能会有一些限制,但是是可以接受的,更快的方法。(例如,对百分比值使用黄土比使用gamlss软件包的LMS快得多)。
同样,该方法的基本R代码将是什么。
谢谢你的帮助。
2
您要求的是“最佳”,这通常在难以讨论和不可能进行明确讨论的任何地方。(“最佳”水平的衡量非常困难。)您已经明确地将问题与儿童的健康状况相关联,但是您对“最佳”的标准并不明确,特别是哪种类型或程度的平滑度是可接受的还是不可接受的。
—
尼克·考克斯
我欢迎这种尝试,但是a)显然不存在,否则为什么会有竞争的解决方案,或者为什么在您正在阅读的文献中这种现象不明显?如果不是几个世纪以前,对此问题的兴趣肯定已经有几十年了。更简单的方法:更容易理解,更容易向医务人员或一般性的统计专家解释,更易于实施,...?毫无疑问,我似乎很挑剔,但为什么要在这里关注速度?这些方法都对计算没有要求。
—
尼克·考克斯
@NickCox:我已经根据您的评论编辑了问题。我将不胜感激。
—
rnso 2014年
抱歉,但是我不在这一领域工作,我认为您的问题很难回答。存在评论是因为人们可能无法或不愿回答,但是仍有话要说。我不写命令的答案。
—
尼克·考克斯