一、各种网页工具没有规范标准
造成误差的原因:数据源不同(各个工具数据源更新时间不同,部分仍使用陈旧的数据)
样本清洗方法不同
生存时间划分差异(OS与DFS),截取时间范围不同
表达数据标准化方式不同(counts数、TPM等)
P值算法差异等
样本差异,缺少部分样本可能导致明显的结果误差,应该尽量使用TCGA最新的临床数据(例:缺少几十个死亡样本的数据绘制效果,与以往文献研究结果违背)
生存状态填反,在R函数中,存活状态以数字0标记,死亡状态以数字1标记,有一定的反直觉性,填反将导致较大的结果错误
时间截取问题,不同时间截取的曲线效果不同,如乳腺癌适合绘制10年生存曲线,时间过长或过短都可能使结果与预期不合
合理绘制的结果(真正与以往研究结果相符)