TCGA分析KM生存曲线存在各种误区

一、各种网页工具没有规范标准

造成误差的原因：数据源不同（各个工具数据源更新时间不同，部分仍使用陈旧的数据）

例如同样的基因，同样的疾病，在不同工具中绘制出的生存曲线却不一致

oncolnc（http://www.oncolnc.org）：

Kaplan-Meier Plotter（http://kmplot.com/analysis）

GEPIA（http://gepia.cancer-pku.cn/）

此外，目前绘制KM生存曲线的工具功能都比较单一，只能绘制单个基因在固定疾病中的KM曲线，不能绘制亚型中的生存曲线，也不能绘制其他因素（例如临床性状）的生存曲线。

二、使用R绘制KM曲线可能因为细节问题产生巨大误差

此外：生存数值处理，当生存数据中包含NA或其他非数字字符时，可能在R环境中被存为非数值格式，转换过程容易产生数值错误

我们绘制生存曲线采用了最新最权威的数据，并且在数据处理上采用了规范、科学的方法，保证结果可信可靠。