摘要: |
目的:探讨多变量缺失数据的不同处理方法对结果的影响.方法:分别利用删除含缺失值的观察、简单填补、多重填补3种方法对多变量中度缺失的925例肝癌患者的临床资料进行统计分析并对其结果进行比较.结果:不同方法所产生的结果差别较大.在α=0.05的水平下,利用多重填补处理的数据集分析得到影响肝癌患者生存时间的危险因素:临床分期、肝硬化史、门脉癌栓、g-GT和WBC;而用删除含缺失值方法得到的却是:TNM分期、碘油剂量、AST、ALP;简单填补比多重填补多产生3个危险因素,分别是:TNM分期、ALP和AFP.结论:本资料采用删除含缺失值的观察的方法结果最差;简单填补相对较好,但容易降低标准误、减小P值;而多重填补处理比较合理、科学.建议对多变量数据缺失的处理一定要慎重. |
关键词: |
DOI:10.3724/SP.J.1008.2004.01013 |
投稿时间:2004-01-04修订日期:2004-05-19 |
基金项目: |
|
Comparison of different methods in management of multivariate missing data |
武建虎,贺佳,贺宪民,程红岩 |
() |
Abstract: |
|
Key words: |