我必须为 5 到 15 岁的儿童(只有 5、6、7 等;没有像 2.6 岁这样的小数值)为非负的、连续的、连续的健康变量创建图表(类似于成长图表) 50-150 的范围(只有少数值超出此范围)。我必须创建第 90、第 95 和第 99 个百分位曲线,并为这些百分位创建表格。样本量约为 8000。
我检查并发现了以下可能的方法:
找到分位数,然后用黄土法从这些分位数中得到一条平滑的曲线。平滑度可以通过“span”参数进行调整。
使用 LMS (Lambda-Mu-Sigma) 方法(例如在 R 中使用 gamlss 或 VGAM 包)。
使用分位数回归。
使用每个年龄组的平均值和 SD 来估计该年龄的百分位数并创建百分位数曲线。
最好的方法是什么?我所说的“最佳”是指作为创建此类增长曲线的标准方法并且所有人都可以接受的理想方法。或者一种更容易实现的方法,它可能有一些限制,但是是一种可以接受的更快的方法。(例如,在百分位值上使用 loess 比使用 gamlss 包的 LMS 快得多)。
此外,该方法的基本 R 代码是什么。
谢谢你的帮助。