前言

结直肠癌是世界上最常见的恶性肿瘤之一,全球每年有超过60万人死于该病 1。在中国,结直肠癌的发病率位列肿瘤发病率前5位,结直肠癌的治疗已经成为我国肿瘤治疗领域不容忽视的重要问题。随着信息技术的飞速发展,医学大数据已经在许多疾病的诊断和治疗中发挥了重要作用。目前,国外已有包括美国的SEER多瘤种数据库 2、欧洲的ACCENT 3结直肠癌数据中心等全球性的肿瘤大数据中心,这些医学大数据平台可以帮助医生总结经验,提升疾病的诊治水平,达到精准治疗的目的。但尚未有全国性的肿瘤学科单一病种的大数据中心。
而目前在全国治疗结直肠癌的各个医疗机构里,虽然在中国90%的医院在用,但是可及性和数据质量却非最优 4。而不同医院使用的商业化医院信息系统提供者达300多家,数据结构和标准有所差异。且不同医疗系统通常也不需要交换数据。各自存储着区域内结直肠癌患者的医学资料,由于每个医院的数据存储方式各不相同,形成了一个个“信息孤岛”,导致这些宝贵的医学资料无法有效的整合利用。
在术语体系方面,虽然我国自2002年已采用了国际疾病编码和国际手术编码,但这两大术语还不能覆盖医疗记录中所有临床信息,而且目前较为广泛采用的医学系统命名法-临床术语(SNOMED CT) 5、统一医学语言系统(UMLS) 6、以及医学语言、百科全书与术语命名通用架构(GALEN)等在中国并不使用。在今精准医学飞速发展的年代,建立规范统一的标准术语体系、打破大数据时代的壁垒迫在眉睫。
CSCO结直肠癌专家委员会联合国内结直肠癌领域领先的多家医院,去年八月份由CSCO结直肠癌专家委员会徐瑞华教授、张苏展教授和医渡云技术有限公司牵头成立“CSCO结直肠癌大数据中心”(BACC)。而通过医渡云的数据平台标准建设流程,将分散于不同医院不同信息系统中的临床信息通过数据采集、清洗、存储、整合等步骤集成云端的数据中心。进而利用自然语言归一技术、结构化和EMPI等先进的机器学习和人工智能技术,对结直肠癌的医疗数据进行规范集成、深度挖掘、综合利用。
现中山大学肿瘤防治中心、CSCO结直肠癌专家委员会联合医渡云(北京)技术有限公司,基于相关术语规范、结直肠癌指南及专家共识等建立基于中国的结直肠癌标准数据集。为后续多项真实世界数据多中心研究筑基,共同构建及推进中国结直肠癌诊疗规范。

徐瑞华

2018年4月