当前官方统计数据质量研究与探索
郭秦川
前 言
“GDP各地区加总比国家的大”、“收入被增长”、“被就业”等枯燥的数据与丰富的内涵与人们实际感受之间存在差异,变得半信半疑、质疑、牢骚,甚或嘲讽,引发社会怨言、关注和热议。习总书记强调“要保持经济增长,继续实施积极的财政政策和稳健的货币政策,增强经济增长的内生活力和动力,增长必须是实实在在和没有水分的增长,是有效益、有质量、可持续的增长”。“没有水分的增长”不仅仅是对实体经济发展的期盼,同时也是对统计工作提出更加严格的要求。无论是质疑、牢骚、嘲讽、关注还是要求,都是对统计工作,特别是统计数据质量问题从不同的角度和深度提出宝贵的意见和建议。当前,如何进一步提高官方(ZF)统计数据质量,推进统计工作的生命线工程蓬勃发展,成为党的十八大以来,统计系统群众路线教育实践活动的有力抓手和落脚点,也是解决经济社会发展中人们更加关注的与自身利益息息相关住房、消费、收入、就业、教育、医疗、社保、环境等统计数据,由此所反映和引发的矛盾与问题更加突出,主要集中在近几年对宏观经济统计数据可信度问题上,这就迫切需要我们认真对待和深入研究探讨,并予以引导和解决。
一、研究统计数据质量的基本认识
研究和探讨官方统计数据质量问题由来已久,并有不少专家学者在不同历史时期和阶段,提出了不同意见和见解,旨在通过不断改革创新统计工作方法和提高工作技术手段来加以完善和改进,为此做出了不懈努力。怎样理解和分析研究统计数据质量这是我们首先要解决的问题。
国际标准化组织(ISO)提出质量是反映实体满足明确和隐含需要能力的特性总和。从这一定义出发,统计数据质量是指每一个数据的所有特性均能满足使用者的潜在要求。不同的用户在不同的时期对统计数据有不同的要求。目前,世界各国统计机构和有关国际组织对统计数据质量含义的解释和理解各不相同,大多从本国的统计实践以及对数据含义的理解不同,确定不同的标准。国际货币基金统计局的质量标准是准确性、适用性、可取得性、方法专业性等方面;美国国民经济分析局要求数据质量满足可比性、准确性、适用性;英国政府统计数据质量标准是准确性、及时性、有效性、客观性等,自2002年我国正式加入国际数据公布通用系统(GDDS)后,对统计数据质量的要求,从数据的准确性、及时性、有效性扩展到数据特征、公布数据质量、公布数据的完整性和公众获取等,数据质量的要求与公布加快向国际惯例和规则融入与使用。根据我国统计实践和国情,官方统计数据质量标准应以准确性、客观性、及时性、有效性、适用性、专业性、可取性、可比性、解释性等为基础标准,来规范官方统计数据质量。
统计数据是统计工作的结晶,其来源通过统计工作各项工作程序、操作规范或者方法制度的组织实施采集、整理、加工最后公布,所以官方统计数据质量的基本标准只有落实和体现到统计的各个具体工作环节的实施中,最终方能得出一个有质量的统计数据。与此同时,确保统计数据质量的难度也越来越大,各种利益主体曰益多元化,各种思想观念错综复杂,各种经济行为多种多样,调查对象的配合意识日趋淡薄,采集真实数据越来越困难的问题摆在各级统计部门面前。政府统计数据面临前所未有的考验和挑战。
如何在错综复杂的环境中,更清醒地认清政府统计面临的问题,正确把握数据质量控制的着力点是统计工作者的神圣责任。从此看,提高官方统计数据质量并不是一件容易的事情。下面我们结合国内具体的统计工作实践,对当前官方统计数据质量的加以分析研究,来探索有利于加强和促进官方统计数据质量的有效方法或措施。
二、当前官方统计数据质量的现状
(一)官方统计体制
官方统计体制是政府体制构架的重要组成部分,通过有效的行使行政管理和协调组织职能,确保统计数据及时、准确地为社会和对象服务。我国官方统计由国家统计机构(国家统计局)、政府有关部(委)门、地方政府统计机构(各级统计局)共同承担的混合型统计体制。(见示意图)
当前官方统计数据体制基本框架
这种体制特点:行政管理逻辑性强,数据获取利简捷及时,效率高。劣势:层级较为复杂,交叉重复环节多,调查样本多元化,数据质量不高等问题较多。
(二)官方统计机制
“机制”原指机器的构造和运作原理,借指事物的内在工作方式,包括有关组成部分的相互关系以及各种变化的相互联系。简单地说,机制就是制度方法或者制度化了的方法。我国官方统计机制是建立在政府行政运作模式下,开展以上级方法制度为基本标准的统计方法制度实施制。从数据的获取(采集)目的、法律依据、方案设计、技术运用、获取途径、指标设置和诠释、时效、以及指标逻辑关系等等,各种调查制度、报表、计算方法、数据的报送途径、结果使用等都有较为严格行政性政策制度规定 。数据的规范与标准来自于上级规定。
这种机制的特点在于:行业管理有效,机制运行便捷顺畅,制度方法规范,标准与技术平台统一,效率高。劣势:实时性弱、灵活性差、易造成虚、假、漏、瞒等现象。
(三) 官方统计方法
统计方法是指有关收集、整理、分析和解释统计数据,并对其所反映的问题做出一定结论的方法。当前统计工作采用的方法:就一次统计活动来讲,一个完整的认识过程一般可分为统计调查、统计整理和统计分析三个阶段。统计工作的各个阶段都有一些专门的方法。在统计调查阶段主要有统计报表制度、重点调查、典型调查、抽样调查、普查等方法;在统计整理阶段,包括统计分布、统计分组、分配数列、统计表、统计图的制作技术等;在统计分析阶段,方法更是多种多样,主要有综合指标法、动态数列法、指数法、抽样法、相关分析法等。
这些方法的特点:目的明确,形式多样,用途各异,结果代表性和服务对象性突出等。劣势:代表性与普遍性差异明显,已产生误导误判……
(四)官方统计数据流程
官方统计是从报表性质、目的以及制度的设计—报表布置(或安排)—填报单位受理—数值采集—数值加工—汇总填报(录入)—审核(复核)—上报(或报批)—公布(或分析)(即从政府需求—客户供给—政府运用—宏观管理—服务客户)。随着统计“四大工程”的进一步深化和使用,国家的超级汇总,缩短了数据采集距离,使技术手段替代数据层级管理和报送,从而简化了实际工作流程。但统计数据的生产流程依然未改。
这一数据生产流程特点:制度规范,标准统一,程序化易加工,时效强。劣势:原数据、复合数据真实与准确性难判别,由于技术手段和流程的不同,易造成局部与全局、上下级汇总结果差异大。
(五)官方统计数据管理
数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。统计数据现行管理模式,是一种数据组织过程,经过数据采集(单位填报始)-汇总(录入)—整理(归纳)-加工-使用(应用),每一个生产过程都隐含着一部数据库管理,其在数据库系统中所建立的数据结构,充分地描述了数据间的内在联系,便于数据修改、更新与扩充,同时保证了数据的独立性、可靠、安全性与完整性,减少了数据冗余,故提高了数据共享程度及数据管理效率。
这种通过计算机数据库管理的特点:技术性强、数据独立完整、快捷、易存储、易扩充、易分享、可靠、效率高。劣势:重复、冗余、质量不高。
(六)官方统计数据质量标准
《统计法》第一章总则,第一条规定“ 为了科学、有效地组织统计工作,保障统计资料的真实性、准确性、完整性和及时性,发挥统计在了解国情国力、服务经济社会发展中的重要作用,促进社会主义现代化建设事业发展,制定本法”明确了统计数据必须“真实、准确、完整和及时”,同时体现了数据的专业性和适用性。“总则”首先对统计工作和数据质量给出了简明的标准:“真实性、准确性、完整性、及时性、专业性和适用性”。
这一标准的特点:数据属性突出、时效和功能性强、专业要求高。劣势:存在重复、冗余、客观性欠缺、可比性和有效性不高需要进一步审核评估、数据本身解释性差、标准没有体现公众的可取性、公信度,标准的技术(信息技术)手段缺失。
(七)官方统计数据法律法规
官方统计数据的采集和适用最直接的受益者是政府本身,主要服务于各级政府进行有效的实施宏观社会经济管理,引导社会经济自发调解完善,促进国家和民族富强、文明、和谐和健康发展。《统计法》《统计法实施细则》《全国经济普查条例》《全国人口普查条例》等法律法规,还有《统计违法违纪行为处分规定》《调查证管理办法》《统计执法检查规定》等规定,以及有关开展统计工作的规范性文件,等等诸如此类的法律法规、政策文件都是围绕统计数据采集、生产和适用而服务,最终体现在统计数据的质量上来。
这些法律法规的特点:强制性、约束性、规范性、时效性、目的性、功能性、针对性等较强。劣势:“软法律”即法律的执行刚性不足;“弱群体”即行业工作的难度、复杂性、职能发挥以及功能作用较弱;职能的自主性弱。
三、当前统计数据质量运行中存在问题
近些年来,我国统计事业随着经济社会的发展得到了长足的发展,统计体制、机制、法制建设、方法制度改革、信息技术保障等积极推进,特别是“四大工程”的实施,数据终端采集应用、统计微博的使用等有力提高了统计数据质量和技术手段,统计数据的质量基本上是有保证的。但是由于各种原因,我国的统计数据质量还存在不容忽视的问题:
(一) 政体之弊。
1、管理之患。现行的统计管理体制实行“统一领导、分级负责”的管理体制,统计业务上以上级统计部门管理为主,在行政上以当地政府领导为主。这种双重管理的体制弊端主要集中反映在基层,地方政府掌握着统计部门的人事和经费等权,主宰着统计的命脉,是“家长”。而《统计法》所赋予统计机构和统计人员的独立性和抗干扰能力,各地区不同程度被弱化和大打折扣,特别是在各级政绩与考核,用人与保位等思想利益驱动下,无法从根本上摆脱“统计围绕计划、目标转”的通病,来自政府内部的行政压力,统计部门也显得无能为力,《统计法》就显得“软弱”。由于缺乏有效监督机制,统计的权益得不到应有的保障,源头数据质量难有保障。
2、机制之痛。
统计制度不够完善,没有统一规范。表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。
从现行统计制度看,不难发现设计思路、口径范围、特别是指标设计仍然带有计划经济时期指标设计的特征,与现今经济社会发展需要和经济专业通用标准以及社会需求口径存在差异。如农业统计指标设置陈旧过时,无用或者用处不大的指标较多,反映生产的指标多,反映投入、效益、市场、三农、现代农业等指标少。同时,统计数据质量或方法制度效果对企业经营管理决策直接作用不明显,统计专业主管部门缺乏对企业统计工作的直接监督与执法检查。
(二)数据重复
从日常的统计实践来看,在数据库中还存在以下两种重复现象:1、 字段值引起的重复,如工商局“企业设立登记信息”中的经营范围”字段值,一条为空,另一条有内容,而其他字段内容都一样,出现两条重复记录;2、过程性记录重复,如工商局“企业变更登记信息”、国税“国税纳税人税务登记(变更)信息”中,均因为“核准日期”字段值的不同,其他字段值相同,而导致重复记录。
(三)数据不完整
1、记录的漏洞。受企业信息变更时效性、准确性等影响,统计字典库更新衔接与相关部门或单位衔接滞后所致企业登记变更漏洞。 2、被数据处理规则清洗掉的数据。这类数据中有些还是有价值的信息。3、字段内容不完整。关键字段信息内容被截断或为空,导致含义不明,无法正常使用,如在行政处罚类信息中,处罚结论字段内容为空或不完整。
(四)信息逻辑性与关联度率偏低
1、表内数据不平衡。如管理费用支出与分项相加不等;现今员工月平均工资不足300元等现象;2、表与表之间的记录存在不合理的逻辑关系。如企业状态实际已注、吊销或数据库登记变更之间信息关联发生矛盾,被“三上企业”和实际企业规模不符等现象。3、部门间提供的有关企业信用信息 存在大量无法通过关联规则的关联记录。如工商部门提供某企业名称为**省有色金属有限公司,中小企业局则提供**有色金属有限公司,统一企业名称的不匹配性,在数据中常出现关联错误。
(五)基层数据处理技术落后
大量的数据要通过产业单位直接填报或调查点人工采集,但数据的起始采集、填报技术各地产业单位发展并不平衡,处理方法和途径差异较大,从基层的手工操作、计算机底端程序运用、调查点数据采集的技术缺陷(农村蔬菜价格采集需要人工操作)到省、国家一级政府统计数据的高技术信息化处理。就地域和技术手段而言,地方统计数据处理显得,速度慢、效率低、质量低、可靠性差,这与统计数据质量标准要求相差甚远,统计数据所反映的当前经济现象的真实性、准确性、有效性难以保证,同时对数据审核评估影响较大。
(六)监督管理措施不完善,力度不足
在日常的统计数据生产过程中,绝大多数单位在数据采集准备、初始录入阶段,由于各种原因和因素导致审核不严格或缺乏审核、监督措施、著录标引的检查、一般采取看大数、自己审核或互相审核的方法。缺少刚性的、科学的、合理的、简便易操作的技术检索清洗手段和责任监督机制,导致统计数据质量评估和监控失效而造成统计数据不同层次脱离实际,给决策带来极大的不便,引起社会质疑和关注。而新研发的检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。
(七) 统计人员队伍稳定性差
由于各种复杂原因,造成基层统计工作队伍薄弱、稳定性差,特别是产业活动单位或调查点统计从业人员更加不稳定性,统计手段相对滞后,统计专业人员业务素质难以在较短时间提升,业务熟练程度低等都会影响统计数据质量。
(八)统计设计时需求不明确,缺乏远见
数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的有相关性。相关性不仅表现在数据依存的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。搜集数据阶段使用的方法不正确,应用需求不明确等都影响了数据完整性和准确性。
四、数据质量的统计专业问题
时常被受关注和质疑的年度、季度甚至月度经济统计数据,主要来至于地区统计数据与部门公布数据、国家统计数据的差异,这些差异与专家学者的认识、群众感受与感性判断不一致,问题主要在:
1、GDP总量、速度与全国的差异。全国或区域数据不等于其下级区域的数据之和。具体来说,省级数据之和往往不等于全国数据,而省级数据也往往不等于其下属的市县数据之和。原因在于,上级对下级上报数据研判时的理论或感性认识上的质量调整。以国家与省级的数据关系为例,国家统计局通常根据其派驻各地的调查总队的数据,对省级统计局的数据进行调整,而各省市专业数据评估的认同标准、核算时用的价格指数又有差异。所以,地方的高估和国家的低估都可能存在。如2009年全国城镇投资增长30%以上,消费增长15%以上,GDP才增长8.7%。各省市总量之和超过全国总量9%左右,速度超过全国2-3个百分点。
2、工业增加值与全国的差异。地方总量超过全国经济总量的70%以上是工业增加值。地方工业增加值比国家高15%左右。原因在于:专业核算与国民经济核算方法制度的差异,地方重复计算,工业增加值率确定不科学,价格指数样本代表偏差等。
3、建筑业增加值与全国的差异。地方总量不平衡,不能反映客观实际。部分地方建筑业总量增加值低估,部分地方建筑业总量增加值高估(主要原因是建筑业地方按注册地单位核算等)。
4、第三产增加值与全国的差异。地方略大于全国,总体基本衔接,地方比国家高4%(2009年)左右。三产大部分核算数据由国家从相关部委取得反馈各地,差异主要在价格指数的取向。其中,固定资产投资地方与国家总量基本衔接,但国家设置上限,导致地方各级不衔接。地方投资热情高涨,投资项目手续合法性界定差异、统计管理规范性差异;社会消费品零售总额地方大于国家3.4%(2009年)左右,地方漏统与虚高并存。
5、城乡居民收入、职工工资,地方普遍高于全国,主要是样本代表性认同上的差异。地方收入住户登记瞒报与地方统计部门加水并存。国贫县扶持政策导致历史数据偏低。
6、地方价格指数与国家的差异。地方样本与国家样本差异,推算总量样本与价格样本不一致差异。
7、地方部门统计与国家的差异。地方部门统计数据与上级审核认定的差异,国家统计局从部委采集地方数据与地方政府统计部门采集的差异。三产增加值核算主要集中在交通运输、金融业、进出口、财政税收、教育、卫生、文化等部门。目前,第三产业增加值核算的基础资料还不全面,如交通运输业、其他服务业增加值的计算,就是使用财政、税务、银行、交通、旅游、邮政、电信等有关部门提供的指标来进行核算的,部门数据的质量直接关系第三产业的发展速度。
8、综合统计数据匹配性不强。部分专业统计数据与部门统计数以及专业统计数据不能完全满足国民经济核算的要求。
(1)各县市区统计数据不统一:主要表现为上下数据存在较大差距。在面临种种考核压力之下,各级、各部门为争名次,基层人员都有一种高报的心理。
(2)核算数据与专业数据不协调:如一些地方出现工业专业规模以上工业增加值大于核算全部工业增加值,有的甚至大于全部第二产业增加值。
(3)各专业统计数据之间的不协调:如两个收入与工资、投资与建筑业、能耗与工业等等。
(4)统计数据与部门数据之间不协调:如交通运输、财政收入、用电量、税收等与经济增长的不协调等等。
(5)季报、年报、普查数据的不协调。普查量大面广、数据繁杂、涉及指标多,而平常季、年度统计时没有这些指标,不掌握相关资料,只能进行推算,时间一长,季年报数据与普查自然形成差异、不协调。同时,因统计制度的原因,同一指标多次出现,即统计上经常出现的预计数、快报数、抽样调查数、年报数,不但使领导、甚至让统计人员有时也晕头转向,弄不清楚。
五、官方统计数据质量问题原因分析
从统计数据生产与质量管理的角度来看,数据质量所存在的问题并不是孤立的,有些问题是相互影响的,甚至有些成因都相同。站在国内统计数据质量基本标准的基础上,不难发现统计数据质量存在诸多问题的原因在于:
从生产角度看:
(一)数据源头质量差异大
基本产业单位填报方式和质量差异突出,有采用手工整理信息的方式报送数据,报送的内容随意性很强;有计算机录入错位、缺项、漏填虚报、编造数据逻辑、指标数值背离指标原意等现象依然存在,其深层次问题是,填报统计数据或报表依法填报,不影响企业具体生产效益,怎样填报、如何填写、数据质量追究意识淡漠,造成源头数据质量较差。
(二)数据采集方案和数据库设计的不合理影响数据质量
数据组织应遵循少冗余和共享性等原则,数据组织不合理将会产生大量数据质量问题。
1、企业财务运转与统计报表设计存在方法制度上的差异。企业执行国家会计准则,理论上是一致的,但在实际的财务会计帐务中,统计指标设置、指标口径、范围等,与实际灵活多样的财务会计帐务口径、范围的对接存在一定的困难和差距,在口径加工和处理中,难免存在质量差异。
2、数据冗余问题。数据库中具有大量的数据冗余,这是产生数据不一致的温床。如所有记录都拥有的基本数据字段设置多余;两个不同字段表达相同意义;多个字段的运算结果再设置字段等等,这些数据冗余必然影响数据的质量。
3、字典库运转效率低。对数据字典库在整个数据管理和应用中的重要性和作用认识不足;需求分析时没有充分理解,没有产生一套科学的字典编码体系;数据字典库更新不及时;数据标准不一致;库容范围狭窄等。
4、关联结构定义不清晰,导致软件程序流程中没有充分利用关联字段关系,同时由于缺乏数据间的关联,现有数据无法进行有效组织,无法对数据的深层挖掘提供支持。
(三)程序控制数据质量差
从数据生产的流程看,数据从采集前的方案设计、制度方法规定、指标口径、范围等等,虽然建立了一套数据处理规则,并具有一定的规范性、通用性,但在实际处理中存在加大差异:由于受数据提供单位对数据重要性和涵义的理解甄别差异,会产生提供的数据类别是完全不一样的。如保险业从业人员为拓展业务,请投保方用餐可以计入财务会计科目销售费用或投保宣传费用中,如果是有色金属企业,为产品销售请顾客用餐,则可记入接待费中。因此报送来的信息的生成规则的数据很多切差异较大。也就是说,不同单位对规则把握的尺度都有差异。此外,程序设计中缺乏对数据记录之间有效性、逻辑性关系的规则设置(数据的时效性、逻辑性缺乏鉴别),缺乏来源于不同部门的数据记录之间逻辑关系的合理性设置。
(四)过程程式化与工作灵活性冲突
政府统计数据质量管理体系非常强调工作过程的标准化,即工作过程严格按照规定程序进行。但现有的政府统计工作相对比较灵活,体系中必须要做的一些工作,现在基本是可做可不做,没有硬性的要求。比如,对企业填报的报表,目前即使填报不完全,只要不影响数据使用就认定为合格表,这在体系中是不可能实现的。因此,需要耗费大量精力处理不规范工作,影响政府统计其他功能的发挥。
(五)统计数据质量管理中的管理不全面
从过程看,只重视调查环节,不重视统计设计对数据需求的研究,从而影响数据相关性、及时性的提高;从统计工作总体看,取得成功的统计数据质量管理的措施及经验,主要集中于几个专项的普查,应用范围较窄;从队伍建设看,只重视统计系统内部的人员监控,而对统计系统外部的,占统计从业人员2/3以上的基层统计从业人员却无从控制
从管理角度看:
(六)数据管理控制简单
一般在日常的数据管理过程中需要对数据进行流程审核、校验、筛选、清洗、修正、入库,这是保证数据质量的重要措施和途径,如果缺少这一途径,那么进入系统的数据质量将无法保证。目前,我国产业活动单位或调查点采集的基础数据,只要是按照报表设计内容填报来的数据,基本上直接进入统计系统核算程序进行整理加工,其中间缺乏必要的审核、校验、筛选、清洗和修正就直接存入系统数据库。新的“四大工程”“一套表”联网直报,也不可回避以上的缺陷。因此,当前的数据规范管理环节严重缺位,进入系统的部分数据缺乏必要的审核校验等程序,数据冗余和垃圾数据的产生就难以避免。
(七)数据管理体系不完善
1、缺乏数据质量评估检验机制
目前,我国统计数据质量评估检验机制还没有形成,只是在国家科研所进行了评估验证理论尝试,没有实质性推广和应用。因此,无法对数据生产和管理流程进行有效监督,各个环节到底出现了哪些不规范的操作尚不得而知,对数据质量监控也就失去作用。只有对数据流程和评估结果进行有效的检验,才能发现问题和错误出现根结,并加以修正,确保数据质量。
2、数据清洗修正机制有待建立
目前,对于问题、错误、垃圾数据大多数放任不用或者听之任之或者人工核实校对,理应发现一个处理一个修正一个,确保数据的质量。当前,还没有成文政策制度来作为有效的数据修正的依据,所以即使发现了数据问题、错误,也难以通过规范的流程进行修正更新。
3、环节节点漏洞的存在及完善
任何看似合理的设计都会存在着缺陷。一方面是由于设计过程影响因素无法全面满足造成的;另一方面是由于时间的因素使外部条件发生变化造成的。存在问题的多样性和复杂性。比如,在投资工作的审核中,指标审核关系每年都要进行调整,主要是设计中没有考虑到基层的新变化、新情况,导致了环节控制的疏漏。
4、数据的非同一性
它是指同一个指标在不同时期的统计范围、口径、内容、方法、单位和价格上有差别而造成的数据的不可比性。例如,2010年的统计资料中工业在500万元以上的为规上工业,而在2011年的统计资料中工业在2000万元以上为规上工业,如果直接比较两年产值得出结论显然是错误的。常见的原因还有:行政干预、缺乏目标监管、数据不完整、计算错误、笔误等。
5、工作标准与人员认可的匹配性
目前,政府统计工作和人员从业性质和任务发生较大变化,但管理本质的仍是计划经济时期管理模式,讲求行政效能最大化,不追求效率的提高,人员管理困难。而政府统计数据质量管理体系的设想立足于追求效率和效益的企业管理模式,二者的出发点不同,运行中势必会发生冲突,主要会表现在:思想观念上、实际工作上。思想观念上主要是多年一贯的认识和新要求有很大差距,自然会产生抵触心理,很难主动地接受新事物。实际工作中主要是改变多年形成的工作习惯,即使思想上认可了,改变也需要一个较长的过程。
从理论上看:
(八)理论及监控技术与统计实践脱节
各种统计数据质量控制技术在我国的实际统计工作中的研究和应用不多,对于经常性统计数据质量控制,实际上还主要是釆用事后的分析评估和调整挤水分的方法,缺乏事前的分类预防控制,误差模型分析较少;应用较多的是一些事后质量控制技术和统计数据质量管理的组织活动没有实现很好的结合,虽然指定了主要统计数据质量的评估方法,但具体方法的应用、由哪些部门负责以及这些部门的质量责任、职权和义务并不明确。
从政府信息运行机制看:
(九)政府部门间信息共享状况不容乐观
我国政府部门在信息资源的开发和利用上相对薄弱,特别是缺乏横纵联通的整合共享机制,直接影响到相关部门的工作效率和行政成本。主要表现在:信息管理机制存在障碍。目前,我国政府尚未建立有效的信息釆集、分类、加工、存储、交换、发布等的管理制度,部门间信息缺少透明共享,技术标准不统一。主要表现在:各部门协调困难,大量重复投入、重复采集、各自为政、造成了资源浪费、行政成本上升、信息集成性不高,政府系统间信息透明共享程度低,没有实现信息化集约管理“联通”;在信息运用方面,信息的动态更新、共享不充分,造成了业务监管的盲区。同时,由于多种因素造成部门间信息化发展程度差异巨大,信息资源紧缺与浪费并存。催生和增加了政府部门间信息共享成本高,导致数据信息质量较低且混乱。这些问题存在极大妨碍了政府统计作为政府信息主渠道作用的发挥,无法及时获得需要的准确部门信息是政府统计数据质量管理体系正常运行的一大棘手问题。但,要想解决也绝不是统计一个部门能够完成的。
六、加强官方统计数据质量的基本思路和探索
信息技术进入统计工作领域后,有力地推进统计手段的极大提高和丰富,技术性数据误差和问题逐步减少,目前,出现更多的问题是由于工作流程控制不当等非技术性误差和问题造成的(例如虚报、瞒报、漏报、篡改等,在原始数据上弄虚作假,汇总上报过程中造假等)。从这一思路分析,解决以人为核心的工作流程监控,应是加强和提高当前数据质量的关键,也是解决政府统计数据质量研究的重点。
(一)优化行政机制,强化数据清源固基
1、依法治统,尙法维实
随着统计事业的不断发展,统计法制建设不断完善,法律法规的适用性逐渐彰显,数据生产、管理和使用有法可依。但在日常的统计工作实践中,依法治统,尙法维实以及违法必究等方面被淡化意识依然存在,统计执法惩治不利,一些领导干部、企业法人等不顾客观事实,不讲党性原则,利用虚假数据,为个人或小团体争政绩、业绩,是产生人为数据质量失控的主要原因,解决的办法就是要随着实体经济的发展变化,不断的建立、完善和修正符合统计数据质量标准要求的信息技术规范以及数据监控机制,细化和量化监控对象数据,并建立与金融、财税、工商、价格或者组织、人事等管理部门协调有效监控约束共享机制,从法律和政策制度设计上,防微杜渐,是给法律赋予刚性约束力。在市场经济条件下,法人主体日益多元化,一些产业活动单位,基础工作薄弱,统计人员不落实,原始记录不健全,更有甚者,受利益驱使弄虚作假,要采取大力宣传统计法,对重点产业活动单位定期或不定期督察,要使经营者懂得,提供真实准确的统计数据是每个调查对象应尽的义务,必须遵守的法律。法规制定的经济处罚、问责、构成违法案件的条文要明确,使惩处者不偿失。
2、创新驱动,强基固本
只有正本清源,数据质量才能从根本上得到提高。随着行业企业性质多元化的布展,现行统计手段与统计任务匹配显得不够,统计技术网络和数据库基础设施建设落后,数据采集难度大,质量难以控制。统计数据质量监控管理,要实事求是,创新驱动,灵活监督管理模式,要以国家信息化建设为契机,借助政府的力量,加强基础化建设,实现统计信息技术现代化和高级化,借助社会信息技术资源,以委托、共同研制、租赁、代办等形式,开发适应统计数据生产、管理和使用过程监控云程序等,从技术的角度,从数据的源头做起,从调查对象的原始数据流程记录开始,自动生成录入数据,减少操作过程中的误差,建立数据库来满足各级统计部门、专业部门的需求和党委政府、社会的需要。要建立和完善数据质量管理规范,明确权责,统计统揽,政府部门和社会分享的数据管理监控政策或办法,杜绝数出多门。对规上重点产业活动单位或者影响经济社会发展的企单位,可细化统计工作管理,从机构、人员定位履职、制度、原始记录、报表、台账等,明确每个点的责任人以责任人变更备案,数据查找有依据,提供数据真实可靠。
(二)建立和完善数据质量监管体系
要从统计数据流程的每个环节出发,建立和完善包括:数据质量管理制度、数据质量考核评估制度、数据筛选清洗规范制度、统计数据质量标准、数据修正制度、数据质量检验和考核制度、数据质量管理征信评级制度等,特别是要建立相对完整和统一的数据标准体系,确保数据资源的标准统一、各管理环节的操作规范,来促进对数据库数据的管控。同时,也可以促进信用信息服务向标准化、规范化发展,为优化数据管理流程,促进统计数据在标准规范的质量监管体系中运行。同时采用,上级部门的审核评估,实时监控,下级部门评议,组织专家的定期巡查、社会调查评估机构联评等方式实施督导与监管。
(三)优化数据清洗规则
1、建立重复数据清洗规则。对于数据生产、管理使用过程中的重复记录,采用人工清洗方法或建立逻辑算法编程来识别重复,剔除冗余。
2、灵活数据处理规则。做好数据校验程序建立和实时修订,借助流程定制工具来设置数据处理流程,完成数据处理流程的灵活配置。
3、增加人工辅助功能。问题数据再处理。对于筛选出的问题数据记录,系统应提供人工辅助处理功能,以便人工逐条比对处理,同时系统应设置详细的数据处理记录,供统计分析研究。
4、错误追究与修正。纠正错误是提高数据质量的一个重要环节。对在数据处理或服务过程中发现的错误数据,要建立错误追究与修正程序和规范,查明原因并通过流程和程序流程进行修正处理,处理后还要对所有存在的数据执行同步操作以更新数据库。
5、数据错误预防。我们在日常统计实践中对错误数据纠正较多预防很少,重视错误数据纠正,忽视了数据错误的预防,这样导致更多的时间用来发现和修正更多的问题。因此,要增加人工审核和编程流程的审核校验步骤,减少数据错误。
(四)建立部门数据信息共享网络共享体系和质量控制
政府统计数据部分是统计数据重要组成部分,又是印证政府统计系统数据质量的有力证据之一。因此,政府统计数据质量控制体系的运行有赖于部门统计信息的共享程度。实现政府统计数据质量管理体系的正常运转,可以从以下几方面进行改进:完善相关法律法规。从立法的角度加强国家或省域统一信息平台体系的应用要求,通过法律约束和引导相关政府部门在数据互联互通领域的行为。同时,使信息基础设施建设、信息平台使用、维护、财力、物力、人力等投入和管理使用,给予法律细分和明确,让各个部门有法可依。即使国家暂时不能出台大的权威法则,也可以利用完善《统计法》的约束力大做文章。加强统筹与协调。在把政府之间、上下左右之间独立的系统连接起来之前,首先形成一个整体协调的战略方案,利用技术上的兼容及软件的通用度,来统一数据信息交互使用规则。目前,国家统计局已经认识到了信息共享的重要性,以大数据研究和建设为契机,积极研究尝试有效统揽全国或省域的方法。
(五)科学界定数据生命周期
信息是一种资源,任何数据信息都有它的生命周期,需要及时清除和维护。目前,及时清理临时性、阶段性或其他非重要结论性内容,便于清楚、准确地研判数据采集对象的信用状况,同时,及时维护和增加用户真正关注的数据,从供需角度定期调整数据类别和数据库系统完善,从技术上是数据由系统优化配置。
(六)积极探索统计数据质量控制方法
1、建立和完善并开展统计数据质量全过程的、全员参加的、以预防为主的数据质量控制原则。首先,统计数据质量控制要贯穿于统计工作的全过程。其次,参加统计数据质量管理和控制的人员业务素质和综合素养应当是全面的,努力提升全体统计工作者统计数据质量业务素质和意识,各个主要的工作环节都要落实专人负责,实现全员督导监控。
2、完善统计设计质量监控。统计数据质量,首先决定于这个过程,它是前提。如果设计出现问题,就会产生大量的数据质量后患。首先,要科学正确制定统计数据质量标准。其次,科学合理采用统计理论,设计统计指标体系及其计算方法。
3、加强数据整理中数据筛选清洗。如果采集数据信息不准,将直接导致结论错误。因此,要特别注意审查收集数据信息的可靠性和适用性,真正弄清楚统计指标的口径范围、指标逻辑关系、计算方法、时点、可比性、解释性、获取性等,发现问题要及时纠正和办结。同时,有效甄别和排除人为因素所影响的数据质量。
(七)实施高素质人才战略
一是在政府统计人员的招聘和遴选上,重点对对口专业以及专业关联度较高的人才给予倾斜,同时,依托关联度较高的专业院校建立和完善人才教育培训战略,以选调、委托、代培等形式,培养大批精通业务,熟悉相关学科,具有“诚信”的理念,实事求是、开拓创新精神的统计工作者。二是强化重视在岗培训。要不断解放思想,奋发进取,更新知识。培养统计人员的预测性,多值性,战略性,以提高他的敏锐性、独立性和想象性。三是要强调统计人员经常深入实际,调查研究,懂得多学科,熟悉各行业,培养造就一支精锐的统计队伍。在工作实践中,努力塑造和培养广大统计工作者创新能力、合作精神、协调能力和职业素养,以适应数据质量标准要求。
(八)吸取与借鉴国际经验和做法,实施过程监控
学习和借鉴国际数据质量管理方面的经验和做法,建立相对独立的专门从事统计数据质量评估的社会中介组织机构或外设机构,依据统计的数据质量标准,对公众比较关心、关系到政绩、业绩的统计进度指标进行评估审核,保持其合法性、公正性、独立性。并赋予质量评估或监督机构以法律职权,开展检查、交流、质量对比分析、指标验证、核查论证、错误修正、结论公布等督促来提高数据质量。
扫码加好友,拉您进群



收藏
