1.2.2 参数估计

上述模型设定为理论计量经济模型,若要测度出特定时间或空间范围内经济变量之间的实际数量依存关系,必须利用收集到的变量数据和恰当的数学方法将模型中的参数估计出来。

1.样本数据

现实中,人们往往难以获取关于经济现象总体变化的数据,多数情况下也不必花费大量时间和财力收集总体数据(如居民家庭调查采取抽样方式,因相同的收入阶层往往具有相近的消费行为模式),而是从总体中随机抽取一定容量的样本,利用样本数据估计总体模型参数,以近似反映变量之间的数量依存关系。为使参数估计值接近其真实值,一方面要求样本分布尽可能与总体分布相同,另一方面要求样本容量要足够大且数据必须完备、真实、可靠。

常用的样本数据主要包括时序数据、截面数据、面板数据和虚拟变量数据等类型。

时序数据(time series data)是指按发生时间先后顺序排列而成的同一指标数据。按反映的时期长短或时点间隔不同,时序数据分为年度数据、半年度数据、季度数据、月度数据和周数据等,例如,不同年份的国内生产总值、消费水平、固定资产投资额、从业人数,不同月度的销售额、货运量等。利用此类数据时需注意:第一,同一变量各项数据在所反映的时间长度、空间范围、计量单位等口径上要保持前后一致;第二,对于受价格因素变动影响的价值指标时序数据,需要利用相关价格指数予以平减,以按不变价计算的价值指标数据估计模型参数,例如在估计居民消费函数模型时,不同时间的居民消费支出数据需要利用定基CPI指数进行平减,以反映居民实际消费支出的变化;第三,时序数据容易使模型产生自相关性,关于其识别方法和修正方法将在后续章节专门进行讨论。

截面数据(cross sectional data)是指在同一时间、不同空间或个体的同一指标数据,如经济普查数据、农业普查数据、居民家庭调查数据等。利用此类数据时需要注意的问题是:第一,样本分布与总体分布的一致性要高,否则,估计的样本回归模型对总体回归模型的代表性就低;第二,截面数据易使模型产生异方差性,导致使用普通最小二乘法得到的参数估计值缺乏有效性等。

面板数据(panel data)是时序数据与截面数据的混合,具有个体、指标、时间三维结构,如利用31个省、直辖市、自治区2000—2018年居民消费支出与可支配收入数据建立模型。使用此类数据建立模型不仅可以弥补单一类型数据样本容量不足的缺陷,还可以同时从纵向、横向上测度各因素对研究对象的定量影响效应。建立面板数据模型,尤其是空间面板计量模型,是现代计量经济学发展的一个重要领域。

虚拟变量数据(dummy variable data)是对定性因素的取值,只有0或1。在虚拟变量作为解释变量时,一般认为定性因素在呈现某种属性或状态时取值为1,呈现其他属性或状态时取值为0,或者在现象发生异常波动时取值为1,在现象正常变化时取值为0。

2.模型识别

在建立联立方程计量经济模型时,需要识别其全部结构式参数能否从参数体系方程组中得到求解。在建立现代计量模型时,主要是识别模型是否存在ARCH效应或变量间是否存在协整关系等问题。一旦出现上述问题,需要对模型进行重新设定或者采用特别的参数估计方法,以保证估计参数具有良好的统计性质,这些专门问题将在后面各章分别予以介绍。

3.估计方法

参数估计方法有很多种。对于单方程计量经济模型,常用的方法有普通最小二乘法、广义最小二乘法、极大似然估计法等;对于联立方程计量经济模型,估计方法有间接最小二乘法、二阶段最小二乘法等。参数估计方法的选择,应视所估计模型的类型、样本数据特点而定,例如,对于线性回归模型,在符合古典假定条件时,可直接使用普通最小二乘法估计其参数,当模型存在异方差时,则需应用加权最小二乘法或广义最小二乘法进行估计。

选用一定方法所估计得到的参数称为参数估计量,所估计得到的模型(或方程)称为样本回归模型(或方程)。例如,采用普通最小二乘法得到式(1-1)的估计式为,其中分别为总体参数Aαβ的估计量。利用特定样本所得到参数估计量的具体数值称为参数的估计值,从总体中抽得的样本不同,所得到的参数估计值也会不同。由于样本是从总体中随机抽取的,所以参数估计值、样本回归模型(或方程)均具有随机性。各种参数估计方法及其应用条件将在后续章节中具体介绍。

4.应用软件

计量经济模型的建立与修正往往需要大量复杂的数据运算,而计算机应用软件的开发与推广为提高计量经济学建模效率和质量提供了极大的便利,可以说在一定程度上推动着计量经济学的发展和计量经济模型的广泛应用。目前可用于建立计量经济模型的应用软件有很多,如SPSS、EViews、SAS、STATA、R等,不同应用软件各有其特点,本书主要介绍EViews 12.0在计量经济模型估计、检验等方面的应用。