我目前正在使用大量的健康保险理赔数据,其中包括一些实验室和药房理赔。但是,数据集中最一致的信息由诊断(ICD-9CM)和过程代码(CPT,HCSPCS,ICD-9CM)组成。
我的目标是:
- 确定最有影响力的前体疾病(合并症),例如慢性肾脏疾病等医学疾病;
- 根据患者过去的病情,确定其患病的可能性(或可能性);
- 进行与1和2相同的操作,但要进行操作和/或诊断。
- 最好,结果可以由医生解释
我看过诸如“ 遗产健康奖里程碑”论文之类的东西,并从中学到了很多东西,但是它们专注于预测住院情况。
所以这是我的问题:您认为哪种方法可以很好地解决此类问题?而且,对于学习与医疗保健和临床医学相关的数据科学应用和方法,哪些资源最有用?
编辑#2添加明文表:
CKD是目标疾病,“慢性肾脏病”,“。any”表示他们随时都有该疾病,“。isbefore.ckd”表示他们在首次诊断CKD之前患有该疾病。其他缩写对应于由ICD-9CM代码分组标识的其他条件。在导入过程中,此分组在SQL中发生。除Patient_age之外,每个变量都是二进制的。