- 结直肠癌标准数据集(2018版)
- 中山大学肿瘤防治中心 中国临床肿瘤学会结直肠癌专家委员会
- 755字
- 2020-08-28 12:07:12
数据集说明
1.结直肠癌标准数据模块
结直肠癌标准模块v1.0
结直肠癌标准数据模块参考国家电子病历及信息化行业标准,以及最新结直肠癌领域诊疗指南,与中山大学肿瘤防治中心结直肠癌专家共建而成。全数据集共集成22个标准模块,510个数据元。数据集由模块名称、参考标准、模块序号、数据元名称、值域及数据加工类型组成。其中:
数据元:每个模块下面包含详细的字段。如“人口学信息”数据模块包含姓名、性别、年龄、民族等多个字段。
参考标准:主要参考国际国内术语标准如ICD10,ATC LONIC等,电子病历规范(HL7 CDA)以及国际及国内疾病标准指南(AJCC,RECIST,NCCN,CSCO) 9-30。
值域:参考主要指南标准及兼顾结直肠癌专家实用性出发的值域作为主要的归一标准。
数据加工:根据数据来源及数据上层加工处理,数据加工主要分三类:①分别直接映射存储规范的数据,如检验数据。②需要通过结构化和归一算法,将大段自然语言处理为标准字段和阈值,并可进行统计分析,如AJCC分期-临床分期。③同一个患者需要根据多份病历或多次结果,多系统来源结果及有时间逻辑的进行多种形式的关联和复杂逻辑计算,如术后病理来源于手术系统及病理系统不同时间的换算。数据加工根据每个场地数据源情况改变,如一些表单已存在前结构化表单,后续数据加工方法则更改为直接映射。
2.数据集更新机制
CSCO结直肠癌大数据中心定期根据指南标准,结合实际数据来源,数据填充率及值域范围进行数据集模块及数据集进行定期更新。更新包括更新时间、更新版本、修订内容及修订原因。相关标准数据集及其更新版本发布于CSCO大数据中心及参与大数据中心各成员结直肠癌专病库。
3.数据集及标准模板使用权限(版权)
版权及相关商标归中山大学肿瘤防治中心、结直肠癌大数据中心(BACC)及医渡云(北京)技术有限公司所有;只能用于参与大数据中心各成员结直肠癌专病库。使用本品须上述各方同意,违者必究。