肿瘤登记数据“一网打尽”,《中国卫生数据库》迎来重大更新

2019-09-24来源:EPS数据平台

《中国卫生数据库》于2019年8-9月间进行了重大优化,增加了全国市、县的肿瘤登记数据,可以更好的适应相关学术研究与政策制定。改版后的《中国卫生数据库》于2019年9月25日正式上线。

一、背景

癌症,又称“恶性肿瘤”,是当今世界人类的主要死因之一。据估计,2012年全球新发1410万例癌症患者,因癌症死亡820万例,5年内现患者 3260 万例。中国情况也不容乐观,据2015中国癌症统计数据报道,中国2015年新发429.2万例癌症患者,因癌症死亡281.4万例。肺癌、胃癌、肝癌、结直肠癌、食管癌、女性乳腺癌、甲状腺癌、宫颈癌、脑瘤和胰腺癌是我国主要的恶性肿瘤,其患者约占全部新发病例的75%。肺癌、肝癌、胃癌、食管癌、结直肠癌、胰腺癌、乳腺癌、脑瘤、白血病和淋巴瘤为主要死因,其患者约占全部肿瘤死亡病例的80%。国家癌症中心2019年1月发布的最新一期全国癌症统计数据显示,恶性肿瘤死亡占居民全部死因的23.91%,近十几年来中国恶性肿瘤的发病死亡均呈持续上升态势,每年恶性肿瘤所致的医疗花费超过2200亿。平均每天超过1万人被确诊为癌症,每分钟有7.5个人被确诊为癌症,防控形势十分严峻。

2019年3月5日,李克强总理在《政府工作报告》中指出:“我国受癌症困扰的家庭以千万计,要实施癌症防治行动,推进预防筛查、早诊早治和科研攻关,着力缓解民生的痛点”。

二、学术研究

癌症严重威胁人民群众健康,近年来我国癌症粗发病率和死亡率呈逐年上升趋势,给家庭和社会造成重大经济负担,是当前社会的重大民生“痛点”,癌症防治刻不容缓。

癌症的防治需要全世界进行大量的研究工作,科研离不开数据,有数据作为支撑,癌症研究这座大厦才能稳固。癌症数据分为实验数据和登记统计数据,前者在癌症的个体治疗研究中占据重要地位,后者对于整体把握癌症分布、开展流行病学调查、制定公共卫生政策具有重大意义。EPS数据平台根据大量的用户调研与反馈,决定在《中国卫生数据库》中增加了全国市、县的肿瘤登记数据,为癌症防治研究、癌症相关政策的制定提供数据支持,进一步响应国家政策,推动癌症防治的进程。

中国肿瘤数据库的数据主要来源于《中国肿瘤登记年报》,由国家癌症中心发布,数据极具权威性,在学术研究中的作用极大。

2.1  总体趋势

利用知网全文检索“中国肿瘤登记年报”,可得到利用《中国肿瘤登记年报》的发文量。可以看到近十年来的总相关发文量达到5000篇以上。自2012年起,利用《中国肿瘤登记年报》的发文量呈快速增长趋势,近几年来总的发文量维持在700篇左右,而相关期刊论文维持在300篇以上,硕博论文每年也达到了300篇的量级,从这可以看到《中国肿瘤登记年报》应用范围较广,较好的支持了肿瘤相关学术研究。

image.png

图1  利用《中国肿瘤登记年报》的不同类别发文量(篇)

提到《中国肿瘤登记年报》,还不得不提到全国肿瘤登记中心主任陈万青教授,他于2016年利用全国肿瘤登记数据发表了一篇名为《Cancer statistics in China,2015》的学术论文,这篇学术论文发表在宇宙第一影响因子神刊《临床肿瘤杂志》(CA: A Cancer Journal for Clinicians),创造了一个“小历史”(2018年《临床肿瘤杂志》影响因子高达224,而久负盛名的Nature与Science影响因子分别为为43和41)。

2.2   机构分布

利用知网全文检索“中国肿瘤登记年报”,可得到利用《中国肿瘤登记年报》发表论文的机构。

整体来看,发文机构主要分布于各大高校,吉林大学、郑州大学、山东大学、苏州大学的文献量位居前五,文献量均为90篇左右,同时也有医院机构对肿瘤进行研究,中国医学科学院肿瘤医院的发文量高居榜首。

对于期刊论文来说,利用《中国肿瘤登记年报》发表的期刊论文主要集中于医院和高校附属医院,同样的,中国医学科学院肿瘤医院的文献量位居第一,高达94篇;而利用《中国肿瘤登记年报》发表的硕博论文则主要分布于各大高校,文献量均为60篇左右,其中吉林大学、郑州大学、广西医科大学、苏州大学、中国协和医科大学的文献量位居前五,文献量为70篇以上。由此可见,高校与医院是利用《中国肿瘤登记年报》进行研究的主要机构, 《中国肿瘤登记年报》对其肿瘤研究提供了坚实的学术研究支持,具有一定的科研价值。

image.png

图2  利用《中国肿瘤登记年报》发表论文的机构分布


image.png

图3  利用《中国肿瘤登记年报》发表的期刊论文机构分布


image.png

图4  利用《中国肿瘤登记年报》发表的硕博论文机构分布

2.3  示例

我们以《中国肿瘤登记年报2016》中的统计数据为例,可以研究各类癌症的地区性差异。《中国肿瘤登记年报2016》收录了2013年全国344个质量较好的市县的肿瘤登记处数据,覆盖人口27729万,其中肿瘤癌症发病数74万、死亡数44万、发病率高达240 (1/10万),涉及了31个地级城市与313个县级行政区域。由图我们可以看出,江苏、山东、安徽、河南、河北地区的发病率位居前五,由此研究人员可以通过地区性差异研究癌症发病率高低的原因,哪些癌症在该地区的发病率较高,从而进行有效的防治癌症。

image.png

图5  2013年全国各地区肿瘤发病率(1/10万)


、《中国卫生数据库》肿瘤登记数据介绍

3.1 介绍

《中国卫生数据库》肿瘤登记数据,数据来源于国家癌症中心,是全面反映我国肿瘤(ICD-10)的发病与死亡情况的数据库。此数据库提供了全国、东部、中部、西部、不同城市化水平组别,31个省(自治区、直辖市)、300多个县级行政单位在肿瘤方面的登记统计数据。主要指标涵盖:登记数据发表情况、主要质控指标、癌症发病和死亡情况。年度数据起始于2003年。

3.2 内容

子库名称

指标大项

年度数据(肿瘤分区域类别)

登记数据发表情况、主要质控指标、癌症发病和死亡情况

年度数据(肿瘤分市县)

登记数据发表情况、主要质控指标、癌症发病和死亡情况

3.3 维度情况                                              

维度情况

维度具体内容

Time-时间

年度数据起始于2003年

Sex-性别

合计、男、女

Region-地区

全国、东部、中部、西部、城市化程度,31个省、自治区、直辖市、300多个县级行政单位

Classify-类别

ICD-10(口腔和咽喉(除外鼻咽癌)、鼻咽、食管、胃、结直肠肛门、肝脏、胆囊及其他、胰腺、喉、气管,支气管,肺、其他胸腔器官、骨、皮肤黑色素瘤、乳房、子宫颈、子宫体及子宫部位不明、卵巢、前列腺、睾丸、肾及泌尿系统部位不明、膀胱、脑,神经系统、甲状腺、淋巴瘤、白血病)

Indicators-指标

登记数据发表情况、主要质控指标、癌症发病和死亡情况

3.4 指标情况

指标大项

指标大项明细(大项指标可展开细分)

登记数据发表情况

全国登记点数,全国登记省(市、区)数、覆盖人口

主要质控指标

病理诊断,只有死亡医学证明,只有死亡医学证明,诊断依据未知,未指明部位及原发部位不明,死亡数/新比例数

癌症发病和死亡情况

癌症发病主要指标,癌症死亡主要指标

 四、中国卫生数据库更新公告

中国卫生数据库,数据来源于国家卫生和计划生育委员会、国家中医药管理局、国家癌症中心,是用于研究我国卫生事业发展和居民健康状况的专业数据库,全方位、深层次地展示了中国卫生行业的运行状况、发展趋势。此数据库提供了全国,31个省、自治区、直辖市的卫生统计数据。不仅可作为医药类院校教师、学生进行课题研究的重要参考资料,也可为卫生行业从业人员提供必要的辅助信息,同时它还可为卫生行业相关决策部门提供强有力的数据支撑。主要数据指标包括:医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,卫生监督,医疗保障制度,人口指标,居民伤病死亡原因等。此外,本数据库还包含了中国数百个市县的肿瘤疾病发病和死亡情况的年度数据、全国医疗服务情况和全国法定传染病疫情的月度数据。数据起始于1949年,年度、月度更新。

 4.1  优化后的数据库内容

子库名称

指标大项

年度数据(全国)

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,卫生监督,医疗保障制度,人口指标

年度数据(分省)

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,食品安全,医疗保障,人口指标

年度数据(分医疗机构)

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务

年度数据(分疾病)

卫生经费,医疗服务,人民健康水平,居民伤病死亡原因

年度数据(分国家)

健康状况,5岁以下儿童死亡率,卫生服务覆盖,环境危险因素,卫生资源,卫生经费,人口与社会经济

年度数据(肿瘤分区域类别)

登记数据发表情况、主要质控指标、癌症发病和死亡情况

年度数据(肿瘤分市县)

登记数据发表情况、主要质控指标、癌症发病和死亡情况

月度数据(全国)

医疗服务,法定传染病疫情

月度数据(分省)

医院和乡镇卫生院医疗服务量,医疗卫生机构数

4.2  维度情况

维度情况

维度具体内容

Time-时间

年度数据起始于1949年,月度数据起始于2004年1月

Sex-性别

合计、男、女

Region-地区

全国、东部、中部、西部、城市化程度,31个省、自治区、直辖市、300多个县级行政单位

Classify-类别

医疗机构,疾病,癌症(ICD-10)

Indicators-指标

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,卫生监督,医疗保障制度,人口指标,居民伤病死亡原因,医疗服务,法定传染病疫情,医院和乡镇卫生院医疗服务量,医疗卫生机构数,健康状况,5岁以下儿童死亡率,卫生服务覆盖,环境危险因素,卫生资源,卫生经费,人口与社会经济、登记数据发表情况、主要质控指标、癌症发病和死亡情况

4.3  优化后新特征分

优化项目

优化前

优化后

数据源

国家卫生和计划生育委员会、国家中医药管理局

国家卫生和计划生育委员会、国家中医药管理局、国家癌症中心

数据库结构

年度数据(全国)

年度数据(分省)

年度数据(分医疗机构)

年度数据(分疾病)

年度数据(分国家)

月度数据(全国)

月度数据(分省)

年度数据(全国)

年度数据(分省)

年度数据(分医疗机构)

年度数据(分疾病)

年度数据(分国家)

年度数据(肿瘤分区域类别)

年度数据(肿瘤分市县)

月度数据(全国)

月度数据(分省)

数据指标涉及内容

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,卫生监督,医疗保障制度,人口指标,居民伤病死亡原因,医疗服务,法定传染病疫情,医院和乡镇卫生院医疗服务量,医疗卫生机构数,健康状况,5岁以下儿童死亡率,卫生服务覆盖,环境危险因素,卫生资源,卫生经费,人口与社会经济

医疗卫生机构,卫生人员,卫生设施,卫生经费,医疗服务,基层医疗卫生服务,中医药,妇幼保健,人民健康水平,疾病控制与公共卫生,卫生监督,医疗保障制度,人口指标,居民伤病死亡原因,医疗服务,法定传染病疫情,医院和乡镇卫生院医疗服务量,医疗卫生机构数,健康状况,5岁以下儿童死亡率,卫生服务覆盖,环境危险因素,卫生资源,卫生经费,人口与社会经济、登记数据发表情况、主要质控指标、癌症发病和死亡情况

优化意义

中国卫生数据库优化后,增加了年度分肿瘤分区域类别和年度分肿瘤分市县的癌症发病与死亡情况的指标数据,为相关研究人员提供了完善的数据支持,从数据的角度为了解、预防与控制癌症提供一定的参考价值,同时提升用户体验。