任务二 统计数据的采集
一、数据采集的基本方法
采集数据是统计分析的基础,因此,数据资料来源的问题就是我们要处理好的关键。数据资料的来源有两个,即统计数据的直接来源和间接来源。
(一)统计数据的直接来源
统计数据的直接来源包括统计调查和科学实验,统计调查的数据采集方法主要有直接观察法、报告法、访问法、问卷法和文献法。
1.直接观察法
直接观察法是调查人员深入现场进行观察、计数或测量以取得所需要数据的方法。例如,要了解企业期末库存商品的数量,调查人员是通过现场的点数、测量和称重取得。再如,人造卫星遥感技术中,气象卫星、资源卫星、侦察卫星等,都是直接观测取得数据。还有在城市的部分街道安装摄像镜头对交通违法车辆进行摄像取证也是直接观察的方法。无论是派员现场调查,还是利用仪器现场观测,都视为直接观察法。直接观察法可以保证资料的准确性,但由于需要花费较多的人力、财力、物力和时间,故在应用上也受到限制。
2.报告法
报告法是被调查单位利用各种原始记录和核算资料作为依据,向有关单位提供统计数据的方法。我国目前各企事业单位所填写的统计报表,是这种数据采集方法的应用。例如我国现行的统计报表制度,就是采用报告法来提供统计数据的,即由报告单位根据各种原始记录和核算资料,按照统一的表格形式和填报要求,在规定的时间内,以一定程序向有关单位提供统计数据的方法。采用这方法也有很大的局限性,其统计数据不易监控,容易出现虚报瞒报的现象。
3.访问法
访问法是按事先拟定的调查事项,有计划地通过口头、网络、电话、邮件、报纸和杂志等方法,向被调查者了解情况,采集统计数据的调查方法。访问法的最大特点是在整个访问过程中,调查者和被调查者要直接沟通,相互作用、相互影响。因此,访问法要取得成功,不仅要求调查者做好各种调查准备工作,注意谈话方式和提问技巧,还要求被调查者密切配合。
在实际调查中,访问法有多种形式,概括起来主要有:
(1)面谈调查。按与被调查者接触的方式不同,面谈调查包括个别访问和座谈访问。个别访问是调查者按照调查提纲的要求,单独地面对面与被调查者进行交谈,或当场填写访问问卷,借以采集数据的一种调查类型。例如,某记者通过对某一个城市居民进行单独采访,了解他对创建文明城市的看法。座谈访问是根据调查提纲,选择部分有代表性的个人进行座谈,如围绕如何应对金融危机问题,在某电视演播室里,几位经济学家接受主持人提出的问题,各抒己见,发表自己的观点。
(2)电话调查。电话调查是以电话为媒介,来采集所需要的数据。如美国的民意调查主要是通过电话调查方式进行的。这种调查方式的前提条件是电话的普及率相当高,调查内容比较简短,优点是回答率比较高。
(3)网络调查。网络调查是通过网络方式所进行的调查,它可以很快采集到网络使用者所提供的信息。这种调查方式既节省时间,又节省费用,更重要的是数据处理非常方便。随着我国网络使用的普及,它的应用有广阔的前景。
访问法的主要优点是:能够把调查与讨论研究结合起来,不仅提出问题,还能探讨、研究解决问题的途径。其不足之处是:由于受访问人员的素质限制,或被访问者的代表性不当等,都可能影响最终的调查结果。
4.问卷法
问卷法是根据调查目的,制定调查问卷,由被调查者按问卷提出的问题或给定的选择答案进行回答的一种专项调查形式。问卷法是国际通行的,也是近年我国经常使用的采集数据的重要方式。它主要有以下特点:
(1)通俗易懂,实施方便。采用问卷法进行数据采集,由于将调查的问题和可供选择的答案均提供给被调查者,由其从中进行选择,因此,被调查者容易接受。
(2)适用范围广。问卷法既适用于对社会政治经济现象进行调查,也适用于对广大群众关心的问题进行调查,还适用于对其他问题进行调查。
(3)节省调查时间,提高调查效率。由于在问卷中已将调查目的、内容和问题及可供选择的答案均一一列出,因此,一般不需详细说明,直接由被调查者选择即可,从而能节省时间,加快调查速度。
问卷法的应用范围比较广泛,问卷的种类也比较多,具体划分主要是:
(1)按问卷中的问题是否有固定答案,问卷分为开放式问卷和封闭式问卷。开放式问卷是问卷中的问题不标明答案,可由填写人自由回答;封闭式问卷是问卷中要标明问题的答案,供填卷人进行选择。在问卷调查中,封闭式问卷更多使用。
(2)按问卷填写者的身份不同,分为“自记式”问卷和“他记式”问卷。“自记式”问卷是由被调查者按调查表项目自己填写的问卷;“他记式”问卷是调查者按调查表项目向被调查者提问,然后根据被调查者的回答填写问卷。
(3)按问卷传递方式不同,分为报纸和刊物问卷、邮政问卷、送发问卷、访问问卷等。
由于问卷调查的回收率和有效率一般都不可能达到100%,因此,调查数量应多于研究数量,以满足调查的要求。确定调查数量的公式为:
例如,某高校对2017级入学新生的家庭经济状况进行一次抽样调查。该项调查采用问卷调查方式,要达到研究目的,样本单位数必须有1260人,若问卷回收率为70%,有效率为90%,则需要发放问卷(调查数量):
即需要发放2000份问卷,才能满足对数据采集的要求。
当前普遍进行的舆论调查、民意调查和商情调查等,一般都采用问卷调查完成。
5.文献法
文献法是指通过查阅文献来收集资料的方法。文献一般分为文字文献、数字文献、图像文献和声音文献。报纸、杂志、图书、档案等是文字文献;统计年鉴、统计报表、会计报表等是数字文献;电影、电视、图片、VCD、DVD等是图像文献;磁带、唱片、CD等是声音文献。随着科学技术的迅速发展,人们可以通过电子计算机上网查阅到越来越多的文献,这种查询不仅省时,而且方便。使用文献法收集资料时,一定要注意对文献质量的审核。
知识链接
统计数据的直接采集除了统计调查外,还有科学试验。科学试验是对社会现象的观察和对自然现象的科学实验的总称。
(1)观察研究。观察研究是研究人员观察所发生的情况,最后得出研究结果。
(2)对照实验。常用对照实验测试新药的效果。一般是将病人随机分为两组:处理组的病人接受治疗,对照组的病人不接受治疗。整个实验在双盲的情况下进行,通过实验数据说明药物效果。
(二)统计数据的间接来源
统计研究所需的数据,如果能通过直接调查或科学试验取得第一手材料固然很好,但由于各方面条件所限,还需要通过其他途径获取别人调查或科学试验的第二手材料,这就是统计数据的间接来源。获得数据的主要途径有:
1.查阅公开出版物
在我国,公开出版的社会经济统计数据主要来自国家和地方的统计部门,以及各种报纸和刊物,如《中国统计年鉴》和各省市的统计年鉴;提供世界各国社会和经济数据的《世界经济年鉴》、《世界发展报告》等。
2.向政府统计机构和其他机构咨询
政府统计机构除定期公布或公开出版数据资料外,还有相当一部分数据资料未公开发布或出版,在不涉及国家机密、商业机密和个人隐私的情况下,可向其了解咨询。学术研究机构、商业性统计调查机构所收集的统计数据,一般需要通过有偿手段进行咨询。
3.上网查询
随着计算机网络技术的普及和发展,可以在网上获取所需的各种数据资料,但要注意方式的合法和数据资料真伪的鉴别。
二、数据采集的组织方式
在明确了统计数据采集的基本方法后,还必须明确在什么组织方式下来采集数据。通常采用的组织方式有统计报表、普查、重点调查、抽样调查和典型调查。
(一)统计报表
统计报表是我国定期取得统计资料的主要方式,也是一种定期统计报告制度。统计报表是由政府统计机关或统计调查的组织机构,按照国家调查文件的统一规定,自上而下布置,自下而上逐级提供统计资料的数据采集方式。国家和有关部门可以通过统计报表取得关于经济发展情况的基本统计数据,统计报表制度也要求每一个有关的企业和事业单位,每一级国家机关或业务管理机构都有义务和责任按照国家规定的调查项目、表格形式、报送程序和报送时间逐级如实上报。
1.统计报表的分类
统计报表按其性质和要求不同,有以下几种类型:
(1)按数据采集的范围不同,分为全面统计报表和非全面统计报表。全面统计报表要求调查对象的每一个单位都要填报;非全面统计报表只要求调查对象中的一部分单位填报,它需要结合其他调查方式运用。目前,我国大多采用全面统计报表。
(2)按所反映内容不同,分为基本报表和业务报表。基本报表是反映国情国力和适应宏观管理、决策需要的统计报表;业务报表是适应有关业务主管部门经营管理需要的统计报表。
(3)按报送周期长短不同,分为日报、旬报、月报、季报、半年报和年报。这些报表不仅有反映时间长短的差别,还包括指标项目繁简的不同。日报、旬报、月报和季报是中短期报表,由于周期较短,要求数据迅速上报,因此项目较少;半年报和年报是长期报表,由于周期较长,要求内容全面、指标详细。特别是年报具有年度总结性质,用来反映当前国家的方针、政策和计划贯彻执行的情况,指标和内容要更全面、详尽。
(4)按填报单位不同,分为基层报表和综合报表。基层报表是由基层企事业单位填报的统计报表;综合报表是由主管部门或统计部门根据基层报表逐级汇总填报的统计报表。
2.统计报表的数据来源
统计报表的数据来源于基层单位的原始记录。从原始记录到统计报表,中间还要经过统计台账和企业内部报表。因此,建立和健全原始记录、统计台账和企业内部统计报表制度,是保证所采集的数据具有高质量的基础。
(1)原始记录。原始记录是基层单位通过一定的表格形式,对生产、经营、管理活动的过程和成果进行广泛的、经常的、群众性的登记,是未经任何加工整理的初级资料。例如商品销售凭证、领料单、个人生产记录等。原始记录工作质量将直接影响报送数据的准确性和及时性。
(2)统计台账。统计台账是根据填报统计报表以及核算工作的需要,将分散的原始记录按时间顺序进行系统登记,积累统计资料的表册。它可以使零散的原始记录或原始核算数字资料系统化。统计台账的种类和格式要根据各基层单位的具体情况而定,生产规模大的基层单位,需要厂部和车间两级设账,生产规模小的基层单位,只需要厂部设账。
(3)内部报表。内部报表大致有两类:一类是向单位领导提供资料而编制的;另一类是为填报上级规定的统计报表而编制的。
3.统计报表的作用
统计报表能够提供反映社会经济发展情况的基本数据,它的作用主要有三个方面:一是为编制国民经济和社会发展计划及检查计划执行情况提供基本依据;二是可以反映我国经济建设和社会发展的成就,并且为研究经济建设的经验及发展的规律性提供必不可少的数据;三是各主管部门能用于指导生产、经营、管理和决策。
统计报表具有统一性、全面性、定期性和制度性的特点,是我国长期以来收集国民经济全面统计资料的一种重要调查方式,但也存在人力、财力、物力和时间耗费较大,数据逐级汇总而造成人为因素影响的局限。特别是统计报表制度是高度集中的计划经济体制下的产物,随着我国社会主义市场经济体制的发展,已难以适应复杂多变的经济类型、经营方式的需要。因此,统计实践中常将统计报表经过调整和改进,并且与其他统计调查方式结合起来应用。
(二)普查
普查是为了了解某种现象在一定时点上的状况,而专门组织的一次性全面调查,如人口普查、物资普查、经济普查等。通过普查可以取得不能用经常调查来收集的社会经济现象的一些较全面、较细致,而且很精确的数字资料,为国家制定有关方针政策,编制国民经济规划提供依据。但普查工作多在全国或较大范围内进行,需要动员大量人力、物力和财力。因此,只有需要摸清国家重要的国情、国力时,才有必要在全国或较大范围内组织普查。
普查的组织方式有两种:一种是组织专门的普查机构和人员,对调查单位进行登记,如我国已进行的五次人口普查都是采用这种方式;另一种是利用调查单位的原始记录和核算资料,发放一定的调查表格,由调查单位进行填报,如我国多次进行的物资库存普查就是采用这种方式。
由于普查的规模大、涉及面广、工作量大、参加人员多,为保证普查数据的准确性、时效性,除了制订详尽的调查方案外,还要注意以下几点:
(1)规定统一的标准时点。标准时点是指对被调查对象登记时所依据的统一时点。这个时点一经确定,所有调查的数据要反映这个时点上的状况,以避免采集数据资料时因情况变动而产生的重复登记和遗漏的现象。例如,我国第六次人口普查的标准时点是2010年11月1日0时,就是要反映该时点我国人口的实际情况。
(2)规定统一的普查期限。在普查范围内各调查单位或调查点要尽可能同时进行普查。并尽可能在最短的期限内完成,保证数据的准确性和时效性。例如,我国第六次人口普查,调查登记期限规定在10天内完成。
(3)规定统一的普查项目和指标。普查项目和指标一经确定,任何普查的分支机构和普查员都不得任意改变或增减,以免影响汇总,降低资料的质量。同一种普查,每次的项目和指标应力求一致,并按一定周期进行,以便更好地进行历次调查资料的对比分析,并观察某种现象变化发展的情况。如人口普查、第三产业普查、工业普查、农业普查都是每10年进行一次,分别在年份尾数逢0、3、5、7的年份实施;基本统计单位普查5年进行一次,分别在年份尾数逢1、6的年份实施。其他年份一般是安排规模相对较小的普查或地区性调查。
普查和全面统计报表都属于全面调查,但二者是不相同的,也不能互相替代。全面统计报表属于连续调查,调查内容主要是需要经常掌握的各种统计数据。由于是经常填报,因此报表内容固定,调查项目较少。普查属于不连续调查,调查内容主要是反映国情国力方面的基本统计数据。由于是专门组织的一次性调查,在调查时就可以包括更多的单位,并且分组更细、项目更多。有些社会经济现象不可能也不需要进行经常调查,但又需要掌握比较全面、详细的数据时,就可以通过普查来解决。
(三)重点调查
重点调查是在调查总体中,选择少数重点单位专门组织的一种非全面调查。
重点调查的关键是选择好重点单位。所谓重点单位,是指在总体中举足轻重的那些单位。这些单位虽然在全部总体中只占较小的比重,但这些单位的标志值之和占总体标志总量的绝大比重,因此对这些单位进行调查,就能反映总体标志总量的基本情况。例如,要了解棉花、茶叶的生产情况,只需对全国几个主要的产棉区、产茶区进行调查,即可掌握全国棉花、茶叶生产的基本情况。又如,要及时了解全国钢铁产量的基本情况,只需要对宝钢、鞍钢、武钢、首钢等十几个大型钢铁企业的生产情况进行调查。虽然就数量来说,这些钢铁企业只占全国钢铁企业的较小比重,但它们的产量却占全国钢铁产量的绝大比重,它们应该是我国钢铁企业中举足轻重的单位。
重点调查的优点在于调查单位较少,但可以调查较多的项目和指标,了解情况较详细,比全面调查节省人力、物力和时间,使各级领导能较快地掌握基本情况,发现问题,采取措施指导工作。所以,当调查任务只要求掌握调查对象的基本情况,而总体又确实存在重点单位时,宜采用重点调查。
重点调查数据的采集主要是组织专门力量对重点单位进行调查,有时也可以发放统计报表由重点单位自行填报。重点单位的选择着眼于标志量占总体标志总量的比重,因而重点单位的选择是具有客观性的。重点调查可以定期进行,也可以不定期进行。
(四)抽样调查
抽样调查是一种专门组织的非全面调查。它是按照随机原则从总体中抽取一部分单位进行观察,并且根据观察结果,从数量上来推断总体指标的一种调查方式。
抽样调查一般适用于对总体不可能或不必要进行全面调查,而又必须掌握总体指标数值的情况。例如,调查电灯泡的使用寿命、皮鞋的质量、饮料卫生指标是否合格等,这类产品质量的检查常常是破坏性的,不可能进行全面调查。而对居民收支情况调查、农作物产量的预测,也不必要进行全面调查。以上调查不可能或不必要进行全面调查,但又必须取得总体的全部数据,因而往往采用抽样调查方式来满足研究目的。同时,运用抽样调查的数据还可以对全面调查的数据加以修正补充。例如,在人口普查中,由于大量人口的流动,常会发生重复登记和遗漏现象,可通过抽样调查的数据进行校正,以有效地提高普查数据的质量。
抽样调查与其他非全面调查比较,具有两个明显特点:一是随机原则。所谓随机原则是指抽取的单位(样本)完全是凭偶然的机会,不受调查者主观意图的影响,每个被调查者被抽中的机会完全相等,因此也叫同等机会原则。抽样调查是按随机原则抽取样本,这是区别于重点调查和典型调查最根本特点。二是从数量上推断总体。其他的非全面调查一般不用来推算总体,而抽样调查却是通过部分调查单位(样本)的调查数据来推算总体。例如,通过抽查部分居民的收入,以推算整个地区居民的全部收入。没有这种数量上的推算,抽样调查就失去意义。有关抽样调查与推断的理论和方法,将在第八章抽样推断技术中讲述。
抽样调查和重点调查都是专门组织的非全面调查,具有调查单位少,省时、省力的特点,并且在选择调查单位时不受主观因素的影响。但二者有三点明显的区别:一是调查单位的意义和取得方式不同。重点调查是选择数量较少但标志量占标志总量绝大比重的单位进行调查;抽样调查是按随机原则从总体中抽取的,具有较高代表性的单位进行调查。二是研究的目的不同。重点调查是为了了解总体基本情况,不能推断总体指标;抽样调查的目的是用样本推断总体指标。三是适用的场合不同。重点调查只适用在总体中具有重点单位的情况;抽样调查适用于不能或不宜进行全面调查,而又需要全面数据的场合。
(五)典型调查
典型调查也是一种专门组织的非全面调查。它是在对被调查对象经过初步分析的基础上,有意识地从中选出若干具有代表性的单位(典型单位)进行调查研究,借以认识事物发展变化规律的一种调查方式。
典型调查的特点:一是通过深入细致的调查,既可以收集数字资料,还可以搜集不能用数字反映的实际情况;二是调查单位是有意识选择出来的若干有代表性的单位,它更多地取决于调查者的主观判断和决策。
典型调查可分为三种方式:第一种是“解剖麻雀”的方法。这种典型调查要求选出少数几个典型单位,通过对这几个典型单位的深入调查研究,用以说明事物的一般情况或发展变化规律。它主要用于调查单位之间差异较小的情况。第二种是“划类选典”的方法。如果作为调查对象的各单位之间差异较大时,可将调查总体划分为若干类,再从每类中选择若干个典型进行调查,以说明各类的情况。第三种是“抓两头”的方法。这就是常说的“抓两头、带中间”。按社会经济组织管理和指导工作的要求,都需要从先进单位和落后单位中选择典型,以便总结经验和教训,带动中间状态的单位,推动整体的发展。
典型调查具有机动灵活,节省人力、财力、物力,资料生动具体等优点,但由于选择典型认识上的差异,容易造成主观上的偏见。因此,正确选择典型,保证典型有充分代表性,是搞好典型调查的关键。所谓典型,就是指在同类事物中具有代表性的事物。如果不经过周密的分析比较,随意确定不具有代表性的单位作典型,就失去了典型调查的意义。典型的选择,应遵循以下原则:
(1)根据调查目的要求来选择。如果为了总结成功的经验,就要选择先进单位为典型;如果为了找出失败的教训,就要选择后进单位为典型;如果是为了掌握一般规律,反映一般情况,或为了推断全面资料,就要选择中等水平的单位为典型。
(2)根据调查对象具体情况,选择典型单位的个数。如果被调查对象各单位差别不大时,典型可少选些;如果差别大,则要多选些,而且最好采用划类选典的方法。
(3)要依靠各级政府和广大群众来选择。各级政府和群众最熟悉当地情况,这样才能使所选典型符合实际,具有真正的代表性。
典型调查和重点调查比较有两点区别:典型调查单位的选择取决于调查者的主观判断,而重点调查的重点单位选择具有客观性;典型调查在一定条件下可以用典型单位的数量推断总体数量,而重点调查不具备推断条件。
(六)各种统计调查方式的结合应用
各种统计调查方式各有其特点,都存在一定的优点和局限性。全面统计报表资料虽然比较系统、及时,但也存在工作量大、环节层次多,容易出现差错和不必要的浪费;普查收集资料全面、准确,但要耗费大量人力、财力、物力,不易经常组织实施;抽样调查虽然能节约人力、财力、物力资源,推算结果也具有科学性,但有较高的技术要求;重点调查能了解总体基本情况,典型调查能深入细致研究,但它们本质上是个别调查,只适宜作其他调查的补充。可见,任何一种调查方式都不是完美无缺的,这就要求在统计实际工作中,把上述各种方式综合应用,取长补短、优势互补,以采集高质量的统计数据。
近几年来,乃至今后相当一段时期,我国的统计方法制度改革所围绕的指导思想是:“建立以周期性普查为基础,以经常性抽样调查为主体,同时辅之以重点调查和科学推算等多种方法综合运用的统计调查方法体系。”这正是多种统计调查方式综合应用的结果。