摘要
目的:揭示中国肺癌外科病理诊断现状及存在问题,进一步提升中国肺癌病理规范和科研数据水平并构建中国肺癌病理结构化大数据库。方法:依据肺癌手术切除标本病理诊断规范内容要求,制定病例报告表,按照病例报告表指标内容要求,回顾性收集23家三甲医院2013年1月至2017年12月手术切除原发肺癌患者原始临床病理资料信息,包括患者基本信息、吸烟史、病理报告(包括分子检测)、治疗及预后等,经脱敏、滤过并利用自然语言处理,结合领域知识库实现原始文本信息结构化处理,进行数据管理分析以及构建结构化数据库。结果:共收集到153 817份原始病理报告,57 748份分子检测报告及13 295条治疗及随访信息,最终获得有效结构化病理报告75 941份(包含86 979个原发肺癌病灶信息)。整体治疗及随访数据质量不满意。患者男女比例为1.2∶1.0;吸烟史可及8 648例(11.39%),吸烟者与非吸烟者比例为0.92∶1.00;高发年龄为60~69岁,占38.76%。常见病理类型前5位依次为腺癌(74.58%),鳞状细胞癌(简称鳞癌,18.01%),小细胞癌(2.18%),腺鳞癌(1.71%),肉瘤样癌(0.82%);组织学类型与性别、年龄及吸烟状态显著相关( P<0.05):男性患者以腺癌(58.5%)和鳞癌(31.6%)为主,女性患者腺癌占91.6%,鳞癌仅占3.4%;非吸烟患者以腺癌(85.6%)为主,吸烟患者腺癌和鳞癌分别占50.6%和37.7%;随年龄增长腺癌占比下降,鳞癌及小细胞癌占比上升。指标使用量呈逐年上升趋势,综合医院与肿瘤专科医院间差异无统计学意义( P<0.05);至2017年使用率较低的主要指标为周围肺病变、pTNM分期、沿气道播散、新辅助治疗反应病理评估。前5位常用免疫组织化学指标依次为甲状腺转录因子1(TTF1)、细胞角蛋白(CK)7、间变性淋巴瘤激酶(ALK)-Ventana、Napsin A及p63,免疫组织化学套餐指标数最常见7~9项。整体表皮生长因子受体(EGFR)突变率51.32%(10 335/20 139,均为PCR法)、ALK融合基因阳性率6.18%[2 084/33 726,PCR、荧光原位杂交(FISH)及免疫组织化学Ventana平台阳性率分别为3.01%、8.93%及6.58%]、KRAS突变率7.01%(662/9 441,均为PCR法)。腺癌中EGFR、ALK(总)、KRAS阳性率分为58.14%(9 986/17 175)、6.59%(1 791/27 176)、7.52%(607/8 068),鳞癌中分别为5.83%(113/1 939)、0.40%(1/251,仅PCR和FISH法)、1.76%(15/852)。由于预后数据质量问题,难以获得有效生存相关因素分析结果。 结论:国内肺癌病理报告规范化程度(包括分子检测)整体基础良好,但大部分模式仍处于非结构化连续文本状态;肿瘤术后病理分期、新辅助治疗反应病理评估及高质量预后数据需予以重视与完善;免疫组织化学指标套餐使用均衡但欠精确;有待采用基于信息系统的肺癌结构化报告模板及结构化数据整合存储模式,以整体提升我国肺癌病理诊断规范及临床数据共享能力。
共0条评论