国务院政府工作报告的“不变”与“变”

2016-03-15来源:EPS数据

每年全国“两会”期间,国务院总理都要做政府工作报告,总结回顾过去一年(任期结束时为过去五年)的工作,同时汇报当年的工作计划和目标。政府工作报告集结了众多政府智囊的心血,广泛反映了社情民意,深度解析政府报告,可发现政府工作报告隐藏的规律。

我们尝试利用文本挖掘,从各方面解读22年(1995-2016)来政府工作报告的“不变”与“变”。

1.政府工作报告总体概貌

我们首先收集整理了1995-2016年的政府工作报告,统计出了每一年政府工作报告所用到的总汉字数,同时统计出了前20个高频汉字占总汉字数的比重(图1)。从这里可以看到,总汉字数相差较大,从13000+到21000+,均值为16319个汉字。而前20个高频汉字占总汉字数的比重则呈现出了明显的下降趋势。这也从侧面反映了随着社会环境等的变化,政府工作报告用字呈现出分散、多样化趋势。

1.png

图1:政府工作报告所用汉字总数与高频词比重


作为反映国民经济运行情况的定量标准,统计数据越来越受到政府与公众的关注,“让数据来说话”,不仅可以客观呈现国民经济的方方面面,也成为领导决策的重要参考依据。我们统计了每一年政府工作报告中用到的数据数目,再比上总的汉字数,可以反映这一年的政府工作报告中数据的“分量”(图2)。从这里可以看到,2003年与2013年用到的数据个数比例明显偏多,这是由于当年分别为朱镕基总理与温家宝总理的最后一次政府工作报告,用到了大量的数据来说明过去五年的国民经济。刨除这两年,可以看到约2005年及之前,政府工作报告中用到的数据并不多,而到了2006年后,政府工作报告大量使用数据,这也凸显了数据的重要性。很有意思的一点是四位总理中,朱镕基总理最不“偏爱”数据,这可能与当时社会环境和领导人个人意志有关。

2.png

图2:数据个数与汉字个数比例

 2.  政府工作报告中的“不变”

我们将每年的政府工作报告进行分词,同时考虑到每年的政府工作报告长短不一,重点不同。我们以每年的前5个高频词的均值为基准,将各高频词除以这个均值,得到高频词的相对值,借此来消除工作报告长短和重点不一的影响,使得可进行时间序列比较。

当前,中国还是一个发展中国家,发展是永恒的时代主题,以经济建设为中心,以改革促发展。从图3中可以看到,改革、发展、经济始终在政府工作报告中占据重要地位。而自2009年之后,政府提到“发展”的频率提高,更侧重于用发展来解决出现的问题。

3.png

图3:“改革”、“发展”与“经济”出现的相对频率

 3.  政府工作报告中的“变”

我们用“社会主义”与“体制”来衡量意识形态(图4),可以看到意识形态在政府工作中的地位稳步下降,政府越来越趋于“务实”。

4.png

图4:“社会主义”与“体制”出现的相对频率

 

“三农”问题一直是政府工作中的重点,特别是自2002年年末,胡锦涛总书记提出把农业、农村、农民问题作为全党工作的重中之重。2004年始,中央连年出台涉农1号文件,形成了一系列三农理论和政策体系。从图5可以看出,相比其他总理,“三农问题”在朱镕基总理任期后期和温家宝总理任期内占据了更重要的地位。自2015年以来,由于国民经济和社会环境的变化,在经济新常态下,“三农”问题不再是焦点,这也从侧面反映了“三农”问题经历了长约10年的重点“关注”,已得到了一定程度的缓解。

5.png

图5:“农民”、“农业”与“农村”出现的相对频率

 4.  政府工作报告的“应季性”

政府工作报告反映了前一年的总体状况,制定当年的计划,与时代紧密相连。从图6中可以看到,1997-1998年的“亚洲金融风暴”,2008年的“美国金融危机”都突出反映在其后的政府工作报告中。

6.png

图6:“金融”出现的相对频率

 

李克强总理上台后,一方面大力推进简政放权,另一方面不断以创新促发展,加大调整结构。从图7中,可以看到“创新”在政府工作报告中出现的频率已超过“三农”,直逼“改革”,是新一届政府中的重中之重,且重要性不断提高。“民生”自2008年中的政府工作报告出现后,一直在保持在稳定的位置,凸显了国家对民生问题的持续重视。

7.png

图7:“创新”与“民生”出现的相对频率

 5.  总结

通过对政府工作报告的文本挖掘,可以看到在1995-2016年的政府工作报告中,“改革”与“发展”是不变的主题;意识形态在政府工作报告中的地位持续下降;“三农”问题经历了长时间的关注,已得到了一定缓解。而自李克强总理上台后,政府工作报告也出现了“新常态”,最大的特点是“创新”,以创新促发展,为经济发展注入新活力。