全部版块 我的主页
论坛 经济学论坛 三区 经济社会统计专版
3776 10
2019-07-28

当前官方统计数据质量研究与探索

郭秦川

  前  言

“GDP各地区加总比国家的大”、“收入被增长”、“被就业”等枯燥的数据与丰富的内涵与人们实际感受之间存在差异,变得半信半疑、质疑、牢骚,甚或嘲讽,引发社会怨言、关注和热议。习总书记强调“要保持经济增长,继续实施积极的财政政策和稳健的货币政策,增强经济增长的内生活力和动力,增长必须是实实在在和没有水分的增长,是有效益、有质量、可持续的增长”。“没有水分的增长”不仅仅是对实体经济发展的期盼,同时也是对统计工作提出更加严格的要求。无论是质疑、牢骚、嘲讽、关注还是要求,都是对统计工作,特别是统计数据质量问题从不同的角度和深度提出宝贵的意见和建议。当前,如何进一步提高官方(ZF)统计数据质量,推进统计工作的生命线工程蓬勃发展,成为党的十八大以来,统计系统群众路线教育实践活动的有力抓手和落脚点,也是解决经济社会发展中人们更加关注的与自身利益息息相关住房、消费、收入、就业、教育、医疗、社保、环境等统计数据,由此所反映和引发的矛盾与问题更加突出,主要集中在近几年对宏观经济统计数据可信度问题上,这就迫切需要我们认真对待和深入研究探讨,并予以引导和解决。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-7-28 22:42:11

一、研究统计数据质量的基本认识

研究和探讨官方统计数据质量问题由来已久,并有不少专家学者在不同历史时期和阶段,提出了不同意见和见解,旨在通过不断改革创新统计工作方法和提高工作技术手段来加以完善和改进,为此做出了不懈努力。怎样理解和分析研究统计数据质量这是我们首先要解决的问题。

国际标准化组织(ISO)提出质量是反映实体满足明确和隐含需要能力的特性总和。从这一定义出发,统计数据质量是指每一个数据的所有特性均能满足使用者的潜在要求。不同的用户在不同的时期对统计数据有不同的要求。目前,世界各国统计机构和有关国际组织对统计数据质量含义的解释和理解各不相同,大多从本国的统计实践以及对数据含义的理解不同,确定不同的标准。国际货币基金统计局的质量标准是准确性、适用性、可取得性、方法专业性等方面;美国国民经济分析局要求数据质量满足可比性、准确性、适用性;英国政府统计数据质量标准是准确性、及时性、有效性、客观性等,自2002年我国正式加入国际数据公布通用系统(GDDS)后,对统计数据质量的要求,从数据的准确性、及时性、有效性扩展到数据特征、公布数据质量、公布数据的完整性和公众获取等,数据质量的要求与公布加快向国际惯例和规则融入与使用。根据我国统计实践和国情,官方统计数据质量标准应以准确性、客观性、及时性、有效性、适用性、专业性、可取性、可比性、解释性等为基础标准,来规范官方统计数据质量。

    统计数据是统计工作的结晶,其来源通过统计工作各项工作程序、操作规范或者方法制度的组织实施采集、整理、加工最后公布,所以官方统计数据质量的基本标准只有落实和体现到统计的各个具体工作环节的实施中,最终方能得出一个有质量的统计数据。与此同时,确保统计数据质量的难度也越来越大,各种利益主体曰益多元化,各种思想观念错综复杂,各种经济行为多种多样,调查对象的配合意识日趋淡薄,采集真实数据越来越困难的问题摆在各级统计部门面前。政府统计数据面临前所未有的考验和挑战。

     如何在错综复杂的环境中,更清醒地认清政府统计面临的问题,正确把握数据质量控制的着力点是统计工作者的神圣责任。从此看,提高官方统计数据质量并不是一件容易的事情。下面我们结合国内具体的统计工作实践,对当前官方统计数据质量的加以分析研究,来探索有利于加强和促进官方统计数据质量的有效方法或措施。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-7-28 22:42:34

二、当前官方统计数据质量的现状

(一)官方统计体制

     官方统计体制是政府体制构架的重要组成部分,通过有效的行使行政管理和协调组织职能,确保统计数据及时、准确地为社会和对象服务。我国官方统计由国家统计机构(国家统计局)、政府有关部(委)门、地方政府统计机构(各级统计局)共同承担的混合型统计体制。(见示意图)

当前官方统计数据体制基本框架

微信图片_20190728224248.jpg

     这种体制特点:行政管理逻辑性强,数据获取利简捷及时,效率高。劣势:层级较为复杂,交叉重复环节多,调查样本多元化,数据质量不高等问题较多。

(二)官方统计机制

    “机制”原指机器的构造和运作原理,借指事物的内在工作方式,包括有关组成部分的相互关系以及各种变化的相互联系。简单地说,机制就是制度方法或者制度化了的方法。我国官方统计机制是建立在政府行政运作模式下,开展以上级方法制度为基本标准的统计方法制度实施制。从数据的获取(采集)目的、法律依据、方案设计、技术运用、获取途径、指标设置和诠释、时效、以及指标逻辑关系等等,各种调查制度、报表、计算方法、数据的报送途径、结果使用等都有较为严格行政性政策制度规定 。数据的规范与标准来自于上级规定。

    这种机制的特点在于:行业管理有效,机制运行便捷顺畅,制度方法规范,标准与技术平台统一,效率高。劣势:实时性弱、灵活性差、易造成虚、假、漏、瞒等现象。

    (三) 官方统计方法

     统计方法是指有关收集、整理、分析和解释统计数据,并对其所反映的问题做出一定结论的方法。当前统计工作采用的方法:就一次统计活动来讲,一个完整的认识过程一般可分为统计调查、统计整理和统计分析三个阶段。统计工作的各个阶段都有一些专门的方法。在统计调查阶段主要有统计报表制度、重点调查、典型调查、抽样调查、普查等方法;在统计整理阶段,包括统计分布、统计分组、分配数列、统计表、统计图的制作技术等;在统计分析阶段,方法更是多种多样,主要有综合指标法、动态数列法、指数法、抽样法、相关分析法等。

  这些方法的特点:目的明确,形式多样,用途各异,结果代表性和服务对象性突出等。劣势:代表性与普遍性差异明显,已产生误导误判……

    (四)官方统计数据流程

     官方统计是从报表性质、目的以及制度的设计—报表布置(或安排)—填报单位受理—数值采集—数值加工—汇总填报(录入)—审核(复核)—上报(或报批)—公布(或分析)(即从政府需求—客户供给—政府运用—宏观管理—服务客户)。随着统计“四大工程”的进一步深化和使用,国家的超级汇总,缩短了数据采集距离,使技术手段替代数据层级管理和报送,从而简化了实际工作流程。但统计数据的生产流程依然未改。

     这一数据生产流程特点:制度规范,标准统一,程序化易加工,时效强。劣势:原数据、复合数据真实与准确性难判别,由于技术手段和流程的不同,易造成局部与全局、上下级汇总结果差异大。

(五)官方统计数据管理

     数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。统计数据现行管理模式,是一种数据组织过程,经过数据采集(单位填报始)-汇总(录入)—整理(归纳)-加工-使用(应用),每一个生产过程都隐含着一部数据库管理,其在数据库系统中所建立的数据结构,充分地描述了数据间的内在联系,便于数据修改、更新与扩充,同时保证了数据的独立性、可靠、安全性与完整性,减少了数据冗余,故提高了数据共享程度及数据管理效率。

这种通过计算机数据库管理的特点:技术性强、数据独立完整、快捷、易存储、易扩充、易分享、可靠、效率高。劣势:重复、冗余、质量不高。

(六)官方统计数据质量标准

《统计法》第一章总则,第一条规定“ 为了科学、有效地组织统计工作,保障统计资料的真实性、准确性、完整性和及时性,发挥统计在了解国情国力、服务经济社会发展中的重要作用,促进社会主义现代化建设事业发展,制定本法”明确了统计数据必须“真实、准确、完整和及时”,同时体现了数据的专业性和适用性。“总则”首先对统计工作和数据质量给出了简明的标准:“真实性、准确性、完整性、及时性、专业性和适用性”。

    这一标准的特点:数据属性突出、时效和功能性强、专业要求高。劣势:存在重复、冗余、客观性欠缺、可比性和有效性不高需要进一步审核评估、数据本身解释性差、标准没有体现公众的可取性、公信度,标准的技术(信息技术)手段缺失。

    (七)官方统计数据法律法规

官方统计数据的采集和适用最直接的受益者是政府本身,主要服务于各级政府进行有效的实施宏观社会经济管理,引导社会经济自发调解完善,促进国家和民族富强、文明、和谐和健康发展。《统计法》《统计法实施细则》《全国经济普查条例》《全国人口普查条例》等法律法规,还有《统计违法违纪行为处分规定》《调查证管理办法》《统计执法检查规定》等规定,以及有关开展统计工作的规范性文件,等等诸如此类的法律法规、政策文件都是围绕统计数据采集、生产和适用而服务,最终体现在统计数据的质量上来。

这些法律法规的特点:强制性、约束性、规范性、时效性、目的性、功能性、针对性等较强。劣势:“软法律”即法律的执行刚性不足;“弱群体”即行业工作的难度、复杂性、职能发挥以及功能作用较弱;职能的自主性弱。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-7-28 22:44:01

三、当前统计数据质量运行中存在问题

近些年来,我国统计事业随着经济社会的发展得到了长足的发展,统计体制、机制、法制建设、方法制度改革、信息技术保障等积极推进,特别是“四大工程”的实施,数据终端采集应用、统计微博的使用等有力提高了统计数据质量和技术手段,统计数据的质量基本上是有保证的。但是由于各种原因,我国的统计数据质量还存在不容忽视的问题:

(一) 政体之弊。

1、管理之患。现行的统计管理体制实行“统一领导、分级负责”的管理体制,统计业务上以上级统计部门管理为主,在行政上以当地政府领导为主。这种双重管理的体制弊端主要集中反映在基层,地方政府掌握着统计部门的人事和经费等权,主宰着统计的命脉,是“家长”。而《统计法》所赋予统计机构和统计人员的独立性和抗干扰能力,各地区不同程度被弱化和大打折扣,特别是在各级政绩与考核,用人与保位等思想利益驱动下,无法从根本上摆脱“统计围绕计划、目标转”的通病,来自政府内部的行政压力,统计部门也显得无能为力,《统计法》就显得“软弱”。由于缺乏有效监督机制,统计的权益得不到应有的保障,源头数据质量难有保障。

  2、机制之痛。

统计制度不够完善,没有统一规范。表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。

从现行统计制度看,不难发现设计思路、口径范围、特别是指标设计仍然带有计划经济时期指标设计的特征,与现今经济社会发展需要和经济专业通用标准以及社会需求口径存在差异。如农业统计指标设置陈旧过时,无用或者用处不大的指标较多,反映生产的指标多,反映投入、效益、市场、三农、现代农业等指标少。同时,统计数据质量或方法制度效果对企业经营管理决策直接作用不明显,统计专业主管部门缺乏对企业统计工作的直接监督与执法检查。

(二)数据重复

从日常的统计实践来看,在数据库中还存在以下两种重复现象:1、 字段值引起的重复,如工商局“企业设立登记信息”中的经营范围”字段值,一条为空,另一条有内容,而其他字段内容都一样,出现两条重复记录;2、过程性记录重复,如工商局“企业变更登记信息”、国税“国税纳税人税务登记(变更)信息”中,均因为“核准日期”字段值的不同,其他字段值相同,而导致重复记录。

    (三)数据不完整

     1、记录的漏洞。受企业信息变更时效性、准确性等影响,统计字典库更新衔接与相关部门或单位衔接滞后所致企业登记变更漏洞。                 2、被数据处理规则清洗掉的数据。这类数据中有些还是有价值的信息。3、字段内容不完整。关键字段信息内容被截断或为空,导致含义不明,无法正常使用,如在行政处罚类信息中,处罚结论字段内容为空或不完整。

   (四)信息逻辑性与关联度率偏低

    1、表内数据不平衡。如管理费用支出与分项相加不等;现今员工月平均工资不足300元等现象;2、表与表之间的记录存在不合理的逻辑关系。如企业状态实际已注、吊销或数据库登记变更之间信息关联发生矛盾,被“三上企业”和实际企业规模不符等现象。3、部门间提供的有关企业信用信息 存在大量无法通过关联规则的关联记录。如工商部门提供某企业名称为**省有色金属有限公司,中小企业局则提供**有色金属有限公司,统一企业名称的不匹配性,在数据中常出现关联错误。

(五)基层数据处理技术落后

大量的数据要通过产业单位直接填报或调查点人工采集,但数据的起始采集、填报技术各地产业单位发展并不平衡,处理方法和途径差异较大,从基层的手工操作、计算机底端程序运用、调查点数据采集的技术缺陷(农村蔬菜价格采集需要人工操作)到省、国家一级政府统计数据的高技术信息化处理。就地域和技术手段而言,地方统计数据处理显得,速度慢、效率低、质量低、可靠性差,这与统计数据质量标准要求相差甚远,统计数据所反映的当前经济现象的真实性、准确性、有效性难以保证,同时对数据审核评估影响较大。

(六)监督管理措施不完善,力度不足

     在日常的统计数据生产过程中,绝大多数单位在数据采集准备、初始录入阶段,由于各种原因和因素导致审核不严格或缺乏审核、监督措施、著录标引的检查、一般采取看大数、自己审核或互相审核的方法。缺少刚性的、科学的、合理的、简便易操作的技术检索清洗手段和责任监督机制,导致统计数据质量评估和监控失效而造成统计数据不同层次脱离实际,给决策带来极大的不便,引起社会质疑和关注。而新研发的检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。

   (七)  统计人员队伍稳定性差

由于各种复杂原因,造成基层统计工作队伍薄弱、稳定性差,特别是产业活动单位或调查点统计从业人员更加不稳定性,统计手段相对滞后,统计专业人员业务素质难以在较短时间提升,业务熟练程度低等都会影响统计数据质量。

(八)统计设计时需求不明确,缺乏远见

数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的有相关性。相关性不仅表现在数据依存的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。搜集数据阶段使用的方法不正确,应用需求不明确等都影响了数据完整性和准确性。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-7-28 22:44:43
Great!是时候检视中国统计工作的机制和体制,并对其基本品质进行评估了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-7-28 22:46:26

四、数据质量的统计专业问题

时常被受关注和质疑的年度、季度甚至月度经济统计数据,主要来至于地区统计数据与部门公布数据、国家统计数据的差异,这些差异与专家学者的认识、群众感受与感性判断不一致,问题主要在:

1、GDP总量、速度与全国的差异。全国或区域数据不等于其下级区域的数据之和。具体来说,省级数据之和往往不等于全国数据,而省级数据也往往不等于其下属的市县数据之和。原因在于,上级对下级上报数据研判时的理论或感性认识上的质量调整。以国家与省级的数据关系为例,国家统计局通常根据其派驻各地的调查总队的数据,对省级统计局的数据进行调整,而各省市专业数据评估的认同标准、核算时用的价格指数又有差异。所以,地方的高估和国家的低估都可能存在。如2009年全国城镇投资增长30%以上,消费增长15%以上,GDP才增长8.7%。各省市总量之和超过全国总量9%左右,速度超过全国2-3个百分点。

2、工业增加值与全国的差异。地方总量超过全国经济总量的70%以上是工业增加值。地方工业增加值比国家高15%左右。原因在于:专业核算与国民经济核算方法制度的差异,地方重复计算,工业增加值率确定不科学,价格指数样本代表偏差等。

3、建筑业增加值与全国的差异。地方总量不平衡,不能反映客观实际。部分地方建筑业总量增加值低估,部分地方建筑业总量增加值高估(主要原因是建筑业地方按注册地单位核算等)。

4、第三产增加值与全国的差异。地方略大于全国,总体基本衔接,地方比国家高4%(2009年)左右。三产大部分核算数据由国家从相关部委取得反馈各地,差异主要在价格指数的取向。其中,固定资产投资地方与国家总量基本衔接,但国家设置上限,导致地方各级不衔接。地方投资热情高涨,投资项目手续合法性界定差异、统计管理规范性差异;社会消费品零售总额地方大于国家3.4%(2009年)左右,地方漏统与虚高并存。

5、城乡居民收入、职工工资,地方普遍高于全国,主要是样本代表性认同上的差异。地方收入住户登记瞒报与地方统计部门加水并存。国贫县扶持政策导致历史数据偏低。

6、地方价格指数与国家的差异。地方样本与国家样本差异,推算总量样本与价格样本不一致差异。

7、地方部门统计与国家的差异。地方部门统计数据与上级审核认定的差异,国家统计局从部委采集地方数据与地方政府统计部门采集的差异。三产增加值核算主要集中在交通运输、金融业、进出口、财政税收、教育、卫生、文化等部门。目前,第三产业增加值核算的基础资料还不全面,如交通运输业、其他服务业增加值的计算,就是使用财政、税务、银行、交通、旅游、邮政、电信等有关部门提供的指标来进行核算的,部门数据的质量直接关系第三产业的发展速度。

8、综合统计数据匹配性不强。部分专业统计数据与部门统计数以及专业统计数据不能完全满足国民经济核算的要求。

(1)各县市区统计数据不统一:主要表现为上下数据存在较大差距。在面临种种考核压力之下,各级、各部门为争名次,基层人员都有一种高报的心理。

(2)核算数据与专业数据不协调:如一些地方出现工业专业规模以上工业增加值大于核算全部工业增加值,有的甚至大于全部第二产业增加值。

(3)各专业统计数据之间的不协调:如两个收入与工资、投资与建筑业、能耗与工业等等。

(4)统计数据与部门数据之间不协调:如交通运输、财政收入、用电量、税收等与经济增长的不协调等等。

(5)季报、年报、普查数据的不协调。普查量大面广、数据繁杂、涉及指标多,而平常季、年度统计时没有这些指标,不掌握相关资料,只能进行推算,时间一长,季年报数据与普查自然形成差异、不协调。同时,因统计制度的原因,同一指标多次出现,即统计上经常出现的预计数、快报数、抽样调查数、年报数,不但使领导、甚至让统计人员有时也晕头转向,弄不清楚。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群