第 7 章 自相关的诊断和矫正
7.2 实验原理
使用时间序列数据建模时,我们往往会面临时间序列数据自相关的现实问题。如果存在自相关问题,则可能对模型及分析结论的科学性产生一定程度影响。
7.2.1 什么时候模型会出现自相关问题?
对于总体回归模型(PRM):
\[\begin{equation} Y_t=\beta_1+\beta_2X_{2t}+\cdots+\beta_kX_{kt}+u_t \tag{7.1} \end{equation}\]
随机干扰项\(u_t\)可能与其滞后变量存在自相关现象,我们定义如下:
定义 7.1 (随机干扰项p阶自相关) 对于给定的滞后阶数\(p(p \subset \mathcal{N})\)下,随机干扰项\(u_t\)与其滞后变量\(u_{t-p}\)之间存在\(cov(u_t,u_{t-p}) \neq0\)。
在经典线性回归模型假设(CLRM)下,我们假设主模型(7.1)随机误差项\(u_t\)是无自相关的,也即\(u_t\)与\(u_{t-1}\)或任意其他滞后变量\(u_{t-p},\ \ p\in (1,2,\cdots)\)都不存在线性相关关系。如果这一假设不能得到保证,我们认为模型将出现自相关问题。
定义 7.2 (模型出现自相关问题) 对于主回归模型,如果给定任意的滞后阶数\(p \in (1,2,\cdots)\),只要随机干扰项\(u_t\)与其滞后变量\(u_{t-p}\)之间存在\(cov(u_t,u_{t-p}) \neq 0\)的现象。
此时,模型(7.1)出现自相关问题也可以表达为方差-协方差的矩阵形式:
\[\begin{align} E(\mathbf{uu'|X})&= \begin{bmatrix} E(u^2_1) & E(u_1u_2) & \cdots & E(u_1u_n) \\ E(u_2u_1) & E(u^2_2) & \cdots & E(u_2u_n) \\ \cdots & \cdots & \cdots & \cdots \\ E(u_nu_1) & \cdots & \cdots & E(u_nu_n) \\ \end{bmatrix} \tag{7.2}\\ &= \begin{bmatrix} \sigma^2_1 & \sigma^2_{12} & \cdots & \sigma^2_{1n} \\ \sigma^2_{21} & \sigma^2_2 & \cdots & \sigma^2_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ \sigma^2_{n1} & \cdots & \cdots & \sigma^2_{nn} \\ \end{bmatrix} \tag{7.2}\\ &= \begin{bmatrix} \sigma^2 & \sigma^2_{12} & \cdots & \sigma^2_{1n} \\ \sigma^2_{21} & \sigma^2 & \cdots & \sigma^2_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ \sigma^2_{n1} & \cdots & \cdots & \sigma^2 \end{bmatrix} \tag{7.3} \end{align}\]
其中,方差-协方差矩阵(见公式(7.2))的协方差部分(矩阵下三角)元素将不全为0(见公式(7.3))。
简而言之,只要的随机干扰项\(u_t\)出现了任何形式的p阶自相关,我们都称模型(7.1)出现自相关问题。一种简单的情形就是马尔科夫1阶自相关:
\[\begin{align} Y_t&=\beta_1+\beta_2X_{2t}+\cdots+\beta_kX_{kt}+u_t \notag \\ u_t&=\rho u_{t-1}+\varepsilon_t \tag{7.4}\\ \varepsilon_t &\sim \text{i.i.d} \ \ N(0,\sigma^2) \tag{7.5} \end{align}\]
当然,模型自相关的情形还有其他更加多样和复杂的形态,例如:
\[\begin{align} u_t&=\rho_1 u_{t-1}+\rho_2 u_{t-2}+\varepsilon_t \tag{7.6}\\ u_t&=\rho_2 u_{t-2}+\varepsilon_t \tag{7.7}\\ &\cdots\\ \varepsilon_t &\sim \text{i.i.d} \ \ N(0,\sigma^2) \tag{7.5} \end{align}\]
7.2.2 随机干扰项自相关有哪些表现形态?
对于马尔科夫1阶自相关情形(见公式(7.4)),如果自相关系数\(-1<\rho<0\),则随机干扰项\(u_t\)及其一阶滞后变量具有某种图形模式(见图7.1):其中\(u_t\)的时序图表现为正弦波形态,而\(u_t\)与\(u_{t-1}\)的散点图表现为正的线性相关关系。

图 7.1: 随机干扰项自相关模式图
7.2.3 自相关问题模型会有什么后果?
模型出现自相关问题时时,主要的影响包括:
- 普通最小二乘法(OLS)估计量仍是线性的、无偏的和一致性的
- 普通最小二乘法(OLS)估计量将不再是有效的(亦即最小方差)
- 模型参数的显著性检验失去意义
- 模型的预测将失效
- 模型的异方差检验流程也会变得不可靠
我们可以对马尔科夫一阶自相关情形做简要的证明:
证明 (马尔科夫1阶自相关下的理论后果). 已知模型存在马尔科夫一阶自相关情形,则有:
\[\begin{align} Y_t&=\beta_1+\beta_2X_{2t}+\cdots+\beta_kX_{kt}+u_t \notag \\ u_t&=\rho u_{t-1}+\varepsilon_t \notag \\ \varepsilon_t &\sim \text{i.i.d} \ \ N(0,\sigma^2_\varepsilon) \notag \end{align}\]
在经典线性回归模型假设下(CLRM),执意采用普通最小二乘法(OLS),我们容易可以得到斜率参数的点估计值\(\hat{\beta}_2\)及其方差\(\mathrm{var}(\hat{\beta}_2)\): \[\begin{align} \hat{\beta}_2 &=\frac{\sum{x_ty_t}}{\sum{x^2_t}}\\ E(\hat{\beta}_2) & =\beta_2 \\ \mathrm{var}(\hat{\beta}_2)^{OLS}_{CLRM} &=\frac{\sigma^2}{\sum{x^2_t}} \end{align}\]
反之,如果我们考虑到一阶自相关问题已经违背了经典线性回归模型假设(CLRM),但仍采用普通最小二乘法(OLS),则斜率参数的点估计值\(\hat{\beta}_2\)及其方差\(\mathrm{var}(\hat{\beta}_2)\)的理论计算结果应该为:
\[\begin{align} \begin{split} \hat{\beta}_2 & =\frac{\sum{x_ty_t}}{\sum{x^2_t}} \\ E(\hat{\beta}_2) & =\beta_2 \\ \mathrm{var}(\hat{\beta}_2)^{OLS}_{AR1} &=\frac{\sigma^2}{\sum{x^2_t}}+\frac{2\sigma^2}{\sum{x^2_t}} \\ &\cdot \left [\rho\frac{\sum_{t=1}^{n-1}{x_tx_{t+1}}}{\sum_{t=1}^n{x^2_t}}+\rho^2\frac{\sum_{t=1}^{n-2}{x_tx_{t+2}}}{\sum_{t=1}^n{x^2_t}}+\cdots+\rho^{n-1}\frac{{x_1x_n}}{\sum_{t=1}^n{x^2_t}} \right ]\\ &\simeq \frac{\sigma^2}{\sum{x^2_t}} \left ( \frac{1+r\rho}{1-r\rho} \right ) \end{split} \end{align}\]
其中,\(r\)为简单相关系数。因此,我们可以发现:
\[\begin{align} \mathrm{var}(\hat{\beta}_2)^{OLS}_{AR1} &\simeq \frac{\sigma^2}{\sum{x^2_t}} \left ( \frac{1+r\rho}{1-r\rho} \right )\\ &=\mathrm{var}(\hat{\beta}_2)^{OLS}_{CLRM}\cdot \left ( \frac{1+r\rho}{1-r\rho} \right ) \end{align}\]
从而证明了\(\mathrm{var}(\hat{\beta}_2)^{OLS}_{AR1}\)与\(\mathrm{var}(\hat{\beta}_2)^{OLS}_{CLRM}\)是不相等的,也即表明当模型存在一阶自相关问题时,普通最小二乘法估计量仍是线性和无偏的,但却不再是方差最小的。12
7.2.4 如何诊断模型存在自相关问题?
显然,模型如果存在自相关问题,应该努力侦察随机干扰项\(u_t\)及其滞后变量\(u_{t-1},\cdots,u_{t-p} \ \ (p\in \mathcal{N})\)的行为模式。
对于总体回归模型存在一阶马尔科夫自回归情形: \[\begin{align} \begin{split} Y_t&=\beta_1+\beta_2X_{2t}+\cdots+\beta_kX_{kt}+u_t \notag \\ u_t&=\rho u_{t-1}+\varepsilon_t \notag \\ \varepsilon_t &\sim \text{i.i.d} \ \ N(0,\sigma^2_\varepsilon) \notag \end{split} \text(PRM-AR1) \tag{7.8} \end{align}\]
我们也有理由认为,样本回归模型(SRM)也会继承总体回归模型(PRM)的特征,从而有:
\[\begin{align} \begin{split} Y_t&=\hat{\beta}_1+\hat{\beta}_2X_{2t}+\cdots+\hat{\beta}_kX_{kt}+e_t \notag \\ e_t&=\hat{\rho} e_{t-1}+v_t \notag \\ v_t &\sim \text{i.i.d} \ \ N(0,\sigma^2_v) \notag \end{split} \text(SRM-AR1) \tag{7.9} \end{align}\]
鉴于样本回归模型(SRM)的残差\(e_t\)及其滞后变量\(e_{t-1},\cdots,e_{t-p} \ \ (p\in \mathcal{N})\)是可观测的,因此诊断模型是否存在自相关问题往往就转化为侦察残差\(e_t\)及其滞后变量\(e_{t-1},\cdots,e_{t-p} \ \ (p\in \mathcal{N})\)的行为模式。总体来看,诊断模型是否存在自相关问题,主要包括两大类方法:
- 图形观察法:
- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot)
- 残差序列观察法(描点图法):确定滞后阶数并分别绘制\(e_t\)序列与\({e_{t-1},e_{t-2},\cdots}\)序列的散点图(scatter plot)
- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot)
- 定量分析法:
- 辅助回归法:构建残差\(e_t\)序列对\({e_{t-1},e_{t-2},\cdots}\)序列的辅助回归方程
- 自相关和偏相关分析法:Eviews菜单操作对残差\(e_t\)序列进行自相关和偏相关分析
- Durbin-Watson检验法:分析Eviews报告中的D-W统计量
- 拉格朗日检验法(LM-test):Eviews菜单操作进行布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test)
- 辅助回归法:构建残差\(e_t\)序列对\({e_{t-1},e_{t-2},\cdots}\)序列的辅助回归方程
显然,模型无自相关是一种假设的理想状态。而事实是,模型只要存在任何一种情形的自相关模式,我们都称模型出现了自相关问题。因此,我们使用以上任一诊断方法,只要发现了自相关的明显证据,则都应该引起重视。
辅助回归方程诊断法:分析主回归模型(7.11),然后或者通过图形观察,或者通过猜测和尝试,再对残差及其滞后变量进行辅助回归建模(7.12)分析:
\[\begin{align} Y_t&={\beta}_1+{\beta}_2X_{2t}+\cdots+{\beta}_kX_{kt}+u_t &&\text{PRM} \tag{7.10} \\ Y_t&=\hat{\beta}_1+\hat{\beta}_2X_{2t}+\cdots+\hat{\beta}_kX_{kt}+e_t &&\text{SRM}\tag{7.11} \\ e_t&=\hat{\rho}_1e_{t-1}+\hat{\rho}_2e_{t-2}+\cdots+\hat{\rho}_pe_{t-p}+\varepsilon_t &&\text{auxiliary equation}\tag{7.12}\\ \end{align}\]
其中,\(p=1,2,\cdots,t-1\)。实际上,具体的辅助诊断模型(7.12)往往需要多次尝试,由简单模型逐渐到扩展模型。为简单起见,我们可以先做AR(1)辅助方程(也即\(e_t\)对\(e_{t-1}\)的回归)或AR(2)辅助方程(也即\(e_t\)对\(e_{t-1}\)和\(e_{t-2}\)的辅助回归)。
辅助回归方程诊断法的诊断标准是:
7.2.5 如何矫正存在自相关问题模型?
对于存在自相关问题的模型,我们的最终目标应该是矫正并得到一个替代的新模型,使得该新模型能满足经典线性回归模型假设(CLRM),从而可以继续采用普通最小二乘法(OLS),最终估计并获得总体参数的最优线性无偏估计量(BLUE)。
自相关问题模型矫正的前提,首要工作是判明问题模型的自相关形式。它可以是简单的马尔科夫一阶自相关(见公式(7.8)),也可以是更复杂的高阶自相关形式。然后再采用针对性的方法,把自相关问题模型处理为无自相关问题的新模型。从模型矫正的操作方法来看,这些针对性的矫正方法可以分为广义差分方程法(General difference equation,GDE )13和一致标准误校正法(Heteroscedasticity and autocorrelation consistent standard error,HAC)14。当然,从实际矫正操作流程来看,矫正方法也可以划分为如下两大类:
- 广义差分方程两步法(Two-steps):
- 广义最小二乘法(GLS):一阶差分法变换
- 广义最小二乘法(GLS):基于残差辅助方程近似得到\(\rho\)
- 广义最小二乘法(GLS):基于D-W统计量近似计算得到\(\rho\)
- 广义最小二乘法(GLS):基迭代法近似计算得到\(\rho\)
- 广义最小二乘法(GLS):一阶差分法变换
- 标准误校正一步法(One-steps):
- 一致标准误校正法(HAC):尼威-威斯特(Newey-West)校正法
7.3 实验内容
采用最小二乘法建立主回归模型
自相关问题模型的侦察方法
- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot)
- 残差序列观察法(描点图法):确定滞后阶数并分别绘制\(e_t\)序列与\({e_{t-1},e_{t-2},\cdots}\)序列的散点图(scatter plot)
- 辅助回归法:构建残差\(e_t\)序列对\({e_{t-1},e_{t-2},\cdots}\)序列的辅助回归方程
- 自相关和偏相关分析法:Eviews菜单操作对残差\(e_t\)序列进行自相关和偏相关分析(注意滞后阶数的选择)
- Durbin-Watson检验法:分析Eviews报告中的D-W统计量
- 拉格朗日检验法(LM-test):Eviews菜单操作进行布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test)
- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot)
自相关问题模型的矫正方法:
- 广义最小二乘法(GLS):一阶差分法变换
- 广义最小二乘法(GLS):基于残差辅助方程近似得到\(\rho\)
- 广义最小二乘法(GLS):基于D-W统计量近似计算得到\(\rho\)
- 广义最小二乘法(GLS):基迭代法近似计算得到\(\rho\)
- 一致标准误校正法(HAC):尼威-威斯特(Newey-West)校正法
- 广义最小二乘法(GLS):一阶差分法变换
7.4 实验准备
7.4.1 实验软件
本次实验需要提前准备好如下软件:
- 统计分析软件Eviews 9.0版本及以上
- 公式编辑软件Mathtype 6.0版本及以上
- 写作编辑软件Office Word/Excel 2010版本及以上
- 浏览器软件chrome 66.0版本及以上或 360极速浏览器9.5版本及以上
7.4.2 实验材料
商业部门的工资水平与生产率:表7.1给出给出了美国46个商业部门Y部门工资水平,X部门生产率等方面的数据。
obs | Y | X |
---|---|---|
1960 | 60.8 | 48.9 |
1961 | 62.5 | 50.6 |
1962 | 64.6 | 52.9 |
1963 | 66.1 | 55.0 |
1964 | 67.7 | 56.8 |
2001 | 113.5 | 119.1 |
2002 | 115.7 | 124.0 |
2003 | 117.7 | 128.7 |
2004 | 119.0 | 132.7 |
2005 | 120.2 | 135.7 |
变量说明见表7.2:
variable | label |
---|---|
obs | 年份 |
Y | 部门工资水平 |
X | 部门生产率 |
请考虑如下样本回归模型:
\[\begin{equation} log(Y_t)=\hat{\beta}_1+\hat{\beta}_2log(X_{2t})+e_{t} \tag{7.13} \end{equation}\]
7.4.3 实验规则
本实验将要求保留Eviews操作过程的相关结果,因此对Eviews对象命名规则设计如下:
- 方程对象(Equation)
的命名规则:
- 主回归方程对象保存命名为
eq_m0
- 自相关问题诊断中的辅助回归方程,根据具体诊断类型,酌情保存并命名为:
- 残差AR1辅助方程诊断法:
eq_ar1_test
- \(\cdots\)
- 残差AR1辅助方程诊断法:
- 自相关问题GLS矫正后的回归方程,根据具体矫正类型,酌情保存并命名为:
- 基于残差辅助方程结果进行1阶广义差分(GLS)矫正:
eq_adj_ar1
- 基于D-W统计量结果进行广义差分(GLS)矫正:
eq_adj_dw
- 基于残差辅助方程结果进行1阶广义差分(GLS)矫正:
- 自相关问题可行广义最小二乘法(FGLS)矫正后的回归方程,根据具体矫正类型,酌情保存并命名为:
- 基于科克伦-奥克特迭代法(Cochrane-Orcutt iterative procedure):
eq_adj_co
- 基于科克伦-奥克特迭代法(Cochrane-Orcutt iterative procedure):
- 自相关问题一致性标准误校正法(HAC),也即尼威-威斯特(Newey-West)校正法矫正后的回归方程,保存并命名为:
eq_adj_nw
- 主回归方程对象保存命名为
- 序列对象(Series)
的命名规则:
- (主回归方程的)残差序列,保存并命名为
et
- (主回归方程的)标准化残差序列,保存并命名为
et_sd
- (主回归方程的)倍数放大(或缩小)的残差序列(此处为放大100倍,具体应视案例而定),保存并命名为
et_100
- (主回归方程的)残差滞后序列,酌情分别保存并命名为:
et_l1
et_l2
- \(\cdots\)
- (主回归方程的)残差序列,保存并命名为
- 图形对象(Graph)
的命名规则:
- 残差\(e_t\)、标准化残差\(e_t^{\ast}\)、倍数放大残差\(\hat{e}_t\)的描点图(dot plot),绘制成一张图,保存并命名为并命名为:
dot_resid
- 残差\(e_t\)相对于残差一阶滞后变量\(e_{t-1}\)的散点图(scatter),保存并命名为并命名为:
scatter_et
- 残差\(e_t\)、标准化残差\(e_t^{\ast}\)、倍数放大残差\(\hat{e}_t\)的描点图(dot plot),绘制成一张图,保存并命名为并命名为:
- 表格对象(Table)
的命名规则:
- 自相关问题的自相关和偏相关诊断法,另存并命名为:
tab_corrl_test
- 自相关问题的拉格朗日诊断法(LM-test),另存并命名为:
tab_LM_test
- 自相关问题的自相关和偏相关诊断法,另存并命名为:
- 标量对象(Scalar)
的命名规则:
- 自相关问题模型矫正的不同方法中,可能会计算得到\(\rho\)的近似$,具体命名视不同矫正方法:
- 基于残差辅助方程结果进行1阶广义差分(GLS)矫正:
rho_ar1
- 基于D-W统计量结果进行广义差分(GLS)矫正:
rho_dw
- 基于科克伦-奥克特迭代法的可行广义最小二乘法(FGLS)矫正:
rho_co
- 基于残差辅助方程结果进行1阶广义差分(GLS)矫正:
- 自相关问题模型矫正的不同方法中,可能会计算得到\(\rho\)的近似$,具体命名视不同矫正方法:
7.5 主要实验步骤
7.5.1 导入数据并进行预处理
- 目标:
- 思路:
- 新建Eviews工作文件(见图7.2)
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y
- Eviews菜单操作:
- 依次操作:File\(\Rightarrow\)New\(\Rightarrow\)Workfile
- 进行workfile create引导设置:
- workfile structure type:
unstructured/undatede
- data range:46
- workfile names(optional):
- WF:
wage
(建议命名) - Page:
corrl
(建议命名)
- WF:
- workfile structure type:
- Eviews导入数据
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y数据(X数据所有同学都一样)
- 菜单操作(Excel和Eviews):
- Excel找到数据。Excel表格中仅保留自己需要的数据(obs, Y, X)
- Eviews导入数据。File\(\Rightarrow\)Import\(\Rightarrow\)Import From File:
d:/econometrics/data/Lab7-wage.xlsx
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y数据(X数据所有同学都一样)

图 7.2: 导入数据的Eviews视窗
7.5.2 采用最小二乘法建立主回归模型
- 目标:
- 思路:
- 提示:主回归模型为
\[log(Y_t)=\hat{\beta}_1+\hat{\beta}_2log(X_{2t})+e_{t}\]
- Eviews菜单操作(见图7.3):
依次选择\(\Rightarrow\)Quick\(\Rightarrow\)Estimation Equation
引导设置Equation Estimation\(\Rightarrow\)specification
- Equation specification:输入命令 log(Y) c log(X)
- Estimation settings:
- Method: 下拉选择
LS - Least Squares (NLS and ARMA)
- Sample: 默认设置
- Method: 下拉选择
- 点击
OK
模型命名:建议为
eq_m0
主回归分析结果见图7.4:

图 7.3: 主回归模型Eviews操作

图 7.4: 主回归模型Eviews报告
7.5.3 侦查模型是否存在自相关问题
诊断方法包括残差观察法、辅助回归法、自相关和偏相关分析法、Durbin-Watson检验法、拉格朗日检验法(LM-test)等。分析Eviews诊断报告,与相关参考标准进行比较,得到相关结论
7.5.3.1 残差观察法:
- 目标:观察残差序列、标准化残差序列,以及残差滞后序列之间的图形模式和图形关系的图形模式
- 思路:判定\(e_t,e^{\ast}_t,e_{t-1},\cdots,e_{t-s}\)等的图形模式和关系
- 提示:
- 描点图(dot plot)是分析一个变量的图形模式。例如残差\(e_t\)或标准化残差\(e^{\ast}_t\)(做纵轴)相对于时间\(t\)(做横轴)的图形关系
- 散点图(scatter plot)是分析两个变量之间的图形模式。例如\(e_t\)(做纵轴),相对于\(e_{t-1}\)或\(e_{t-2}\)或\(e_{t-s}\)的图形关系。
- Eviews菜单操作:
- 分别生成残差序列\(e_t\)、放大100倍的残差(请根据实际情况酌情考虑调整倍数,目的是便于与标准化残差做比较)、标准化残差序列\(e^{\ast}_t\)和滞后一阶变量\(e_{t-1}\)序列(见图7.5)
- 命令视窗(Command)依次输入命令(建议分别命名为et、et_100、et_sd和et_l1)
series et=resid
series et_100=100*resid
series et_sd=et/@stdev(et)
series et_l1=et(-1)
- 运行命令:命令行中按Enter键
- 查看结果:
- 双击
et
- 双击
et_100
- 双击
et_sd
- 双击
et_l1
- 双击
- 命令视窗(Command)依次输入命令(建议分别命名为et、et_100、et_sd和et_l1)
- 绘制残差\(e_t\)和标准化残差\(e^{\ast}_t\)序列的描点图(dot plot)(见图7.6)
- 选择序列对象:键盘Ctrl键+依次单击选择序列
et和
et_sd
- 进入引导菜单:\(\Rightarrow\) Quick \(\Rightarrow\) Graph
- 选择绘图类型(Graph type):Dot plot
- 选择绘图细节(Detail):\(\Rightarrow\) Multiple series \(\Rightarrow\) 下拉选择 Multiple graphs
- 点击完成:OK
- 命名并保存绘图(graph)对象
:建议命名为dot_resid
- 查看结果:双击
dot_resid(见图7.7)
- 选择序列对象:键盘Ctrl键+依次单击选择序列
- 绘制\(e_t\)序列对\(e_{t-1}\)的散点图(scatter plot)(见图7.8)
- 选择序列对象:键盘Ctrl键+依次单击选择序列
et;
et_l1
- 进入引导菜单:\(\Rightarrow\) Quick \(\Rightarrow\) Graph
- 选择绘图类型(Graph type):Scatter
- 选择绘图细节(Detail):默认设置
- 点击完成:OK
- 命名并保存绘图(graph)对象
:建议命名为scatter_et
- 查看结果:双击
scatter_et(见图7.8)
- 选择序列对象:键盘Ctrl键+依次单击选择序列
- 分别生成残差序列\(e_t\)、放大100倍的残差(请根据实际情况酌情考虑调整倍数,目的是便于与标准化残差做比较)、标准化残差序列\(e^{\ast}_t\)和滞后一阶变量\(e_{t-1}\)序列(见图7.5)

图 7.5: 生成相关变量

图 7.6: 残差及标准化残差的描点图

图 7.7: 残差及标准化残差的描点图报告

图 7.8: 残差与残差滞后变量的散点图
7.5.3.2 辅助回归法:
目标:根据残差图模式,构建残差辅助回归方程,得到你的初步结论
思路:分析残差\(e_t\)序列对\(e_{t-1},e_{t-2},\cdots\)序列的辅助回归方程(7.12)的Eviews报告
Eviews操作(此处仅展示AR(1)辅助回归方程的情形,菜单操作实现具体见图7.9):
- 依次选择\(\Rightarrow\) Quick \(\Rightarrow\) Estimation Equation
- 引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
et et_l1
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为eq_ar1_test)
- 查看结果:双击
eq_ar1_test
- Equation specification:输入命令
- 依次选择\(\Rightarrow\) Quick \(\Rightarrow\) Estimation Equation
具体Eviews报告见7.10:

图 7.9: 残差辅助回归方程的Eviews诊断操作

图 7.10: 残差辅助回归方程的诊断报告
7.5.3.3 自相关和偏相关分析法
目标:根据残差自相关和偏相关图表结果,得到你的初步结论
思路:分析残差\(e_t\)序列对\(e_{t-1},e_{t-2},\cdots\)序列的自相关和偏相关Eviews报告(注意滞后阶数的选择)
Eviews操作(菜单操作实现,具体见图7.11):
- 打开残差序列:双击序列(Series)对象
et
- 进入引导菜单:\(\Rightarrow\) View \(\Rightarrow\) Correlogram \(\Rightarrow\) Correlogram Specification
- 设置诊断序列(Correlogram of): 点击选择Level
- 设置诊断阶数(Lags to include):默认设置
- 完成设置:点击Ok
- 命名并保存表格(table)对象
- 另存为表格(table)对象:点击Freeze
- 命名并保存表格(talbe)对象:点击name(建议为tab_corrl_test)
- 查看结果:双击
tab_corrl_test
- 打开残差序列:双击序列(Series)对象
具体Eviews报告见7.12:

图 7.11: 残差自相关和偏相关分析的Eviews操作

图 7.12: 残差自相关和偏相关的Eviews报告
7.5.3.4 Durbin-Watson检验法
7.5.3.5 拉格朗日检验法(LM-test)
目标:对主回归方程进行布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test),根据诊断标准,得出初步结论
思路:利用Eviews菜单操作Residual Diagnostics \(\Rightarrow\) Serial Correlation LM Test
理论提示:
- 布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test)可以检验高阶自相关的情形(见模型(7.14))
- 布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test)将计算得到一个服从\(\chi^2\)分布的LM统计量,具体为\(LM=(n-p)R^2~\chi^2_p\)
\[\begin{equation} u_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\cdots+\rho_pe_{t-p}+\varepsilon_t \tag{7.14} \end{equation}\]
- 诊断标准
- Eviews操作(菜单操作实现,具体见图7.13):
- 打开主方程:双击方程(equation)对象
eq_m0
- 进入引导菜单:\(\Rightarrow\) View \(\Rightarrow\) Residual Diagnostics \(\Rightarrow\) Serial Correlation LM Test
2) 设置检验阶数(Lag Specification): 输入滞后阶数1(酌情尝试)
- 完成设置:点击Ok
- 命名并保存表格(table)对象
- 另存为表格(table)对象:点击Freeze
- 命名并保存表格(table)对象:点击name(建议为tab_LM_test)
- 查看结果:双击
tab_LM_test
- 打开主方程:双击方程(equation)对象
具体Eviews报告见7.14:

图 7.13: 拉格朗日自相关检验的Eviews操作

图 7.14: 拉格朗日自相关检验的Eviews报告
7.5.4 自相关问题模型的矫正
7.5.4.1 广义最小二乘法(GLS):广义差分法变换(自相关系数已知)
目标:对主回归方程进行合适的广义差分变换,使得变换以后的新模型不再有自相关问题
思路:如果主模型随机干扰项的自相关系数已知(见模型(7.16)),则可以直接用差分变换得到新模型(见模型(7.18)),容易证明新模型将不再有自相关问题(见模型(7.19))。
理论提示:如下将展示一阶自相情形下的广义差分变换的理论过程
\[\begin{align} Y_t & =\beta_1+\beta_2X_{2t}+u_{t} && \text{PRM} \tag{7.15}\\ u_t & =\rho u_{t-1}+\varepsilon_t && \text{AR(1)} \tag{7.16}\\ \rho Y_{t-1} & =\rho \beta_1+\beta_2\rho X_{2t-1}+\rho u_{t-1} && \text{Lag 1 Model} \tag{7.17}\\ (Y_t-\rho Y_{t-1}) & =\beta_1(1-\rho)+\beta_2(X_{2t}-\rho X_{2t-1})+(u_t-\rho u_{t-1}) && \Delta\text{ Model} \tag{7.18}\\ Y^{\ast}_t & =\beta^{\ast}_1+\beta^{\ast}_2X^{\ast}_{2t}+\varepsilon_{t} && \text{Adjusted Model} \tag{7.19}\\ \end{align}\]
其中,AR(1)模型(7.16)中的\(\varepsilon_t\sim i.i.d\ \ N(0,\sigma^2_{\varepsilon})\)。
7.5.4.2 广义最小二乘法(GLS):基于残差辅助方程近似估计得到\(\rho\)(自相关系数未知)
目标:对主回归方程进行合适的广义差分变换,使得变换以后的新模型不再有自相关问题
思路:如果主模型随机干扰项的自相关系数未知(见模型(7.21)),则可以直接用基于残差辅助方程估计得到\(\hat{\rho}\),再根据\(\rho\simeq\hat{\rho}\)用广义差分变换得到新模型(见模型(7.25)),容易证明新模型将不再有自相关问题(见模型(7.26))。
理论提示:如下将展示一阶自相情形下的广义差分变换的理论过程
\[\begin{align} Y_t & =\beta_1+\beta_2X_{2t}+u_{t} && \text{PRM} \tag{7.20}\\ u_t & =\rho u_{t-1}+\varepsilon_t && \text{AR(1)} \tag{7.21}\\ Y_t & =\hat{\beta}_1+\hat{\beta}_2X_{2t}+e_{t} && \text{SRM} \tag{7.22}\\ e_t & =\hat{\rho}e_{t-1}+v_t && \text{Auxiliary Model} \tag{7.23}\\ \rho & \simeq \hat{\rho} \notag \\ \rho Y_{t-1} & =rho \beta_1+\beta_2\rho X_{2t-1}+\rho u_{t-1} && \text{Lag 1 Model} \tag{7.24}\\ (Y_t-\rho Y_{t-1}) & =\beta_1(1-\rho)+\beta_2(X_{2t}-\rho X_{2t-1})+(u_t-\rho u_{t-1}) && \Delta1\text{ Model} \tag{7.25}\\ Y^{\ast}_t & =\beta^{\ast}_1+\beta^{\ast}_2X^{\ast}_{2t}+\varepsilon_{t} && \text{Adjusted Model} \tag{7.26} \end{align}\]
其中,AR(1)模型(7.21)中的\(\varepsilon_t\sim i.i.d\ \ N(0,\sigma^2_{\varepsilon})\)。
- Eviews菜单操作
- 提取辅助回归方程的回归系数。构建一个标量(Scalar)对象
rho_ar1,并将辅助回归方程的回归系数赋值给这个标量对象rho_ar1。具体过程参看图7.15
- 命令视窗(Command)输入命令 :
scalar rho_ar1=@round(10000*eq_ar1_test.@coefs(1))/10000
- 运行命令:命令行中按Enter键
- 查看结果:双击
rho_ar1
- 命令视窗(Command)输入命令 :
- 进行一阶广义差分变换,并估计新模型。依次选择\(\Rightarrow\)Quick\(\Rightarrow\)Estimation Equation\(\Rightarrow\)specification。具体过程参看图7.16
- Equation specification:输入命令
(log(y)-rho_ar1*log(y(-1))) c (log(x)-rho_ar1*log(x(-1)))
- Estimation settings:
- Method: 下拉选择
LS - Least Squares (NLS and ARMA)
- Sample: 默认设置
- Method: 下拉选择
- 点击
OK
- 模型命名:建议为
eq_adj_ar1
- 查看结果:双击
eq_adj_ar1
- Equation specification:输入命令
- 说明(Eviews代码行的解读^[具体细节请参看Eviews在线帮助文档,网址http://www.eviews.com/help/helpintro.html#page/content%2FRegress1-Equation_Output.html%23):
- 代码
scalar rho_ar1=@round(10000*eq_ar1_test.@coefs(1))/10000
表示给创建一个标量(Scalar)对象rho_ar1,并把辅助模型(7.12)的回归系数的第一个值提取出来,并赋值给这个名为rho_ar1的标量对象,同时保留四位小数。
- 代码
eq_ar1_test.@coefs(1)
表示提取方程(equation)对象eq_ar1_test的回归系数的第一个值。
- 代码
@round(10000*( ))/10000
表示对数据保留4为小数。
- 代码
- 提取辅助回归方程的回归系数。构建一个标量(Scalar)对象

图 7.15: 基于残差辅助方程近似计算自相关系数

图 7.16: 基于残差辅助方程的广义差分矫正操作

图 7.17: 基于残差辅助方程的广义差分矫正报告
7.5.4.3 广义最小二乘法(GLS):基于D-W统计量近似计算得到\(\rho\)(自相关系数未知)
目标:对主回归方程进行合适的广义差分变换,使得变换以后的新模型不再有自相关问题
思路:如果主模型随机干扰项的自相关系数未知(见模型(7.28)),则可以基于Durbin-Waston检验的d统计量计算得到\(\hat{\rho}\)(见模型(7.29)和模型(7.30)),再根据\(\rho\simeq\hat{\rho}\)用广义差分变换得到新模型(见模型(7.32)),容易证明新模型将不再有自相关问题(见模型(7.33))。
理论提示:如下将展示一阶自相情形下的广义差分变换的理论过程
\[\begin{align} Y_t & =\beta_1+\beta_2X_{2t}+u_{t} && \text{PRM} \tag{7.27}\\ u_t & =\rho u_{t-1}+\varepsilon_t && \text{AR(1)} \tag{7.28}\\ d & \simeq2(1-\hat{\rho}) && \text{Durbin-Waston} \tag{7.29}\\ \hat{\rho} & \simeq 1-d/2 \tag{7.30}\\ \rho & \simeq \hat{\rho} \notag \\ \rho Y_{t-1} & =rho \beta_1+\beta_2\rho X_{2t-1}+\rho u_{t-1} && \text{Lag 1 Model} \tag{7.31}\\ (Y_t-\rho Y_{t-1}) & =\beta_1(1-\rho)+\beta_2(X_{2t}-\rho X_{2t-1})+(u_t-\rho u_{t-1}) && \Delta1\text{ Model} \tag{7.32}\\ Y^{\ast}_t & =\beta^{\ast}_1+\beta^{\ast}_2X^{\ast}_{2t}+\varepsilon_{t} && \text{Adjusted Model} \tag{7.33} \end{align}\]
其中,AR(1)模型(7.28)中的\(\varepsilon_t\sim i.i.d\ \ N(0,\sigma^2_{\varepsilon})\)。
- Eviews菜单操作
- 提取并得到Durbin-Waston统计量。构建一个标量(Scalar)对象
,建议命名为dw。具体过程参看图7.18
- 命令视窗(Command)输入命令 :
scalar dw=eq_m0.@dw
- 运行命令:命令行中按Enter键
- 查看结果:双击
rho_dw
- 命令视窗(Command)输入命令 :
- 计算得到自相关系数的近似值\(\rho \simeq\)=1-d/2$。构建一个标量(Scalar)对象
,建议命名为rho_dw。具体过程参看图7.18 。
- 命令视窗(Command)输入命令 :
scalar rho_dw=@round(10000*(1-dw/2))/10000
- 运行命令:命令行中按Enter键
- 查看结果:双击
rho_dw
- 命令视窗(Command)输入命令 :
- 进行一阶广义差分变换,并估计新模型。依次选择\(\Rightarrow\)Quick\(\Rightarrow\)Estimation Equation\(\Rightarrow\)specification。具体过程参看图7.19
- Equation specification:输入命令
(log(y)-rho_dw*log(y(-1))) c (log(x)-rho_dw*log(x(-1)))
- Estimation settings:
- Method: 下拉选择
LS - Least Squares (NLS and ARMA)
- Sample: 默认设置
- Method: 下拉选择
- 点击
OK
- 模型命名:建议为
eq_adj_dw
- 查看结果:双击
eq_adj_dw
- Equation specification:输入命令
- 说明(Eviews代码行的解读^[具体细节请参看Eviews在线帮助文档,网址http://www.eviews.com/help/helpintro.html#page/content%2FRegress1-Equation_Output.html%23):
- 代码
scalar d=eq_m0.@dw
表示给创建一个标量(Scalar)对象dw,并把主模型(7.13)的Durbin-Waston统计量值提取出来,并赋值给这个名为dw的标量对象。
- 代码
scalar rho_dw=@round(10000*(1-dw/2))/10000
计算得到标量(Scalar)对象rho_dw,并对数据取4位小数。
- 代码
- 提取并得到Durbin-Waston统计量。构建一个标量(Scalar)对象

图 7.18: 基于Durbin-Waston统计量近似计算自相关系数

图 7.19: 基于Durbin-Waston统计量的广义差分模型矫正操作

图 7.20: 基于Durbin-Waston统计量的广义差分模型矫正报告
7.5.4.4 可行广义最小二乘法(FGLS):基迭代法近似计算得到\(\rho\)(自相关系数未知)
- 目标:对主回归方程进行合适的广义差分变换,使得变换以后的新模型不再有自相关问题
- 思路:
- 如果主模型随机干扰项的自相关系数未知,而且存在高阶自相关情形,则可以使用基于迭代的可行广义最小二乘法(FGLS)计算得到\(\hat{\rho_1},\hat{\rho_2},\cdots,\hat{\rho_p}\ \ p\in(1,2,\cdots)\),再根据\(\rho\simeq\hat{\rho}\)用广义差分变换得到新模型(见模型(7.32)),容易证明新模型将不再有自相关问题(见模型(7.33))。
- 这些迭代方法主要包括科克伦-奥克特迭代法(Cochrane-Orcutt iterative procedure) ;科克伦-奥克特两步法(Cochrane-Orcutt two-step procedure) ;德宾两步法(Durbin two-step procedure) ;希尔德雷思-卢扫描或搜寻程序(Hildreth-Lu scanning or search procedure) 等
- 理论提示:如下将展示科克伦-奥克特迭代法下对二阶自相关(\(AR(p),p=2\))情形下的广义差分变换的理论过程
\[\begin{align} Y_t & =\beta_1+\beta_2X_{2t}+u_{t} && \text{PRM} \tag{7.34}\\ u_t & =\rho_1u_{t-1}+\rho_2u_{t-2}+\varepsilon_t && \text{AR(2)} \tag{7.35}\\ \cdots & \text{Cochrane-Orcutt iterative procedure} \notag \\ \rho_p & \simeq \hat{\rho_p} \notag \\ \rho_1Y_{t-1} & =\rho_1\beta_1+\beta_2\rho_1X_{2t-1}+\rho_1u_{t-1} && \text{Lag 1 Model} \tag{7.36}\\ \rho_2Y_{t-2} & =\rho_2\beta_1+\beta_2\rho_2X_{2t-2}+\rho_2u_{t-2} && \text{Lag 2 Model} \tag{7.37}\\ \end{align}\]
\[\begin{align} \begin{split} (Y_t-\rho_1Y_{t-1}-\rho_2Y_{t-2}) & =\beta_1(1-\rho_1-\rho_2)\\ & +\beta_2(X_{2t}-\rho_1X_{2t-1}-\rho_2X_{2t-2}) \\ & +(u_t-\rho_1u_{t-1}-\rho_2u_{t-2}) \end{split} && \Delta2\text{ Model} \tag{7.38} \end{align}\]
\[\begin{align} Y^{\ast}_t &=\beta^{\ast}_1+\beta^{\ast}_2X^{\ast}_{2t}+\varepsilon_{t} && \text{Adjusted Model} \tag{7.39} \end{align}\]
- Eviews菜单操作(此处展示的是AR(1)的自相关情形,见图7.21):
依次选择\(\Rightarrow\)Quick\(\Rightarrow\)Estimation Equation
引导设置Equation Estimation\(\Rightarrow\)specification
- Equation specification:输入命令 log(Y) c log(X) AR(1)
- Estimation settings:
- Method: 下拉选择
LS - Least Squares (NLS and ARMA)
- Sample: 默认设置
- Method: 下拉选择
- 点击
OK
模型命名:建议为
eq_adj_CO
主回归分析结果见图7.22:
提取并得到科克伦-奥克特迭代法下近似的残差自相关系数\(\rho\)。构建一个标量(Scalar)对象
,建议命名为rho_co。具体过程参看图7.23
- 命令视窗(Command)输入命令 :
scalar rho_co=eq_adj_co.@coefs(3)
- 运行命令:命令行中按Enter键
- 查看结果:双击
rho_co
- 命令视窗(Command)输入命令 :
说明(Eviews代码行的解读^[具体细节请参看Eviews在线帮助文档,网址http://www.eviews.com/help/helpintro.html#page/content%2FRegress1-Equation_Output.html%23):
- 代码
scalar rho_co=eq_adj_co.@coefs(3)
表示给创建一个标量(Scalar)对象rho_co,并把方程(Equation)对象
eq_adj_co的第三个回归系数提取出来,赋值给这个标量对象
rho_co。
- 代码

图 7.21: 基于科克伦-奥克特迭代法的FGLS模型矫正Eviews操作

图 7.22: 基于科克伦-奥克特迭代法的FGLS模型矫正Eviews报告

图 7.23: 基于科克伦-奥克特迭代法近似计算的自相关系数
7.5.4.5 一致性标准误校正法(HAC):尼威-威斯特(Newey-West)校正法
目标:直接用尼威-威斯特(Newey-West)一致性标准误矫正流程方法,构建回归分析模型,此时模型的自相关问题将会有所缓解。
思路:利用Eviews菜单操作,进行基于尼威-威斯特(Newey-West)一致性标准误矫正程序的建模分析。
理论提示:(数学表达和证明过程略)
- 异方差-自相关一致性标准误(heteroscedasticity-autocorralation consistent standard errors,HAC)也被简称为尼威-威斯特一致性标准误(Newey-West consistent standard errors)
- 尼威-威斯特(Newey-West)一致性标准误矫正程序或菜单,在主流的统计软件里都会配置
- 尼威-威斯特(Newey-West)一致性标准误矫正程序,严格意义上对于大样本数据是有效的,因此不太适合于小样本数据的情形。
Eviews操作(见图7.24)
- 依次选择\(\Rightarrow\) Quick \(\Rightarrow\) Estimation Equation
- 引导设置Equation Estimation \(\Rightarrow\) Specification
- 方程设置(Equation Specification): 输入变量log(Y) c log(X)
- 估计方法(Estimation settings):
- Method:选择
LS - Least Squares(NLS and ARMA)
- Sample: 默认设置
- Method:选择
- 引导设置Equation Estimation \(\Rightarrow\) Options
- 系数协方差设置(Coefficient covariance)
- 协方差方法(Coefficient method):下拉选择HAC (Newey-West)
- 权重设置(Weights):默认设置
- 最优化设置(Optimization):默认设置
- 完成设置:点击
OK
- 系数协方差设置(Coefficient covariance)
- 模型命名:建议为
eq_adj_NW
- 查看分析报告(见图7.25)
- 依次选择\(\Rightarrow\) Quick \(\Rightarrow\) Estimation Equation

图 7.24: 尼威-威斯特(Newey-West)矫正法的操作

图 7.25: 尼威-威斯特(Newey-West)矫正法的Eviews报告
7.6 作业题
存货案例:表7.3给出给出了41年的Y存货(百万美元),X2销售额(百万美元)等方面数据。
Year | Y | X2 |
---|---|---|
1950 | 84646 | 46486 |
1951 | 90560 | 50229 |
1952 | 98145 | 53501 |
1953 | 101599 | 52805 |
1954 | 102567 | 55906 |
1986 | 423082 | 326227 |
1987 | 408226 | 334616 |
1988 | 439821 | 359081 |
1989 | 479106 | 394615 |
1990 | 509902 | 411663 |
变量说明见表7.4:
variable | label |
---|---|
Year | 年份 |
Y | 存货(百万美元) |
X2 | 销售额(百万美元) |
请考虑如下样本回归模型:
\[\begin{align} Y_t & =\beta_1+\beta_2X_{2t}+u_{t} \text{M0} \tag{7.40}\\ ln(Y_t) & =\beta_1+\beta_2ln(X_{2t})+u_{t} \text{M0} \tag{7.41} \end{align}\]
请回答如下问题:
根据总体回归模型(7.40),请对模型参数的理论预期(符号、大小、关系)进行说明。
利用Eviews对模型(7.40)进行回归分析(将报告截图过来,并写出相应的简要报告形式——三行式或四行式)。参数估计结果符合你的理论预期么?
回归模型(7.40)存在自相关问题的证据吗?请按照下列方法分别进行诊断,并分别得到分析结论(要求截图过来并进行简要说明):
\[\begin{equation} e_t=\hat{\rho}_1e_{t-1}+\hat{\rho}_2e_{t-2}+\cdots+v_t \tag{7.12} \end{equation}\]- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot),得到你的初步结论。
- 残差序列观察法(描点图法):根据前述观察,确定滞后阶数并分别绘制\(e_t\)序列与\(e_{t-1},e_{t-2},\cdots\)序列的散点图(scatter plot),得到你的初步结论
- 辅助回归法:构建残差\(e_t\)序列对\(e_{t-1},e_{t-2},\cdots\)序列的辅助回归方程(7.12),得到你的初步结论
- 自相关和偏相关分析法:Eviews菜单操作对残差\(e_t\)序列进行自相关和偏相关分析(注意滞后阶数的选择)
- Durbin-Watson检验法:分析Eviews报告中的D-W统计量
- 拉格朗日检验法(LM-test):Eviews菜单操作进行布罗施-戈弗雷(Breusch-Goldfrey)的拉格朗日检验(B-G LM test)
- 残差序列观察法(描点图法):绘制\(e_t\)序列的描点图(dot plot),得到你的初步结论。
若发现回归模型(7.40)存在自相关问题,你如何对该模型进行矫正?请按照下列方法分别进行诊断,并分别得到分析结论(要求截图过来并进行简要说明):
如果模型(7.40)与上面各种方法修正的结果相差较大,你认为哪一个方法要相对较好,为什么?
读者可以验证\(r=0.6,\rho=0.8\)时,二者的方差大小关系↩︎
本质上属于广义最小二乘法(General least square,GLS)↩︎
这种方法是对异方差怀特一致性标准误矫正法(White heteroscedasticity consistent standard error)的扩展↩︎
具体可以参看Eviews在线帮助文档。网址http://www.eviews.com/help/helpintro.html#page/content/timeser-Testing_for_Serial_Correlation.html↩︎
理论查表值可以参考在线文档https://www3.nd.edu/~wevans1/econ30331/Durbin_Watson_tables.pdf↩︎