第 8 章 虚拟变量回归模型
8.2 实验原理
计量经济学建模分析中,我们常常需要把一些定性变量(Qualitative variables)(如性别、地区、党派等)作为自变量放入回归模型中。从变量层次(Variable Scale)来看,这些变量没有具体的取值,只有特定属性类别。例如,性别变量的具体取值往往为男或女。显然,诸如此类的变量如果直接放到线性回归模型中,将会产生一系列的参数估计、模型解释等问题。
staff | salary | sale | score | race |
---|---|---|---|---|
Zhang | 25 | 140 | 2 | yellow |
Tom | 35 | 195 | 3 | white |
Lee | 27 | 184 | 1 | yellow |
Jeff | 42 | 256 | 5 | white |
Kevin | 38 | 207 | 4 | black |
区域经理年薪案例中(见表8.1),公司有五名区域经理,分别负责不同的国际市场。定量变量\(salary\)表示区域经理的年薪(万元);变量\(sale\)表示负责市场的销售额;变量\(score\)表示客户对区域经理的评价(1表示很不满意,2表示不满意,3表示一般,4表示很满意,5表示非常满意);变量\(race\)表示区域市场主要消费群体的肤色(yellow表示黄色消费群体、white表示白色消费群体,black表示黑色消费群体)。
定义 8.1 (定量变量) 定量变量(Quantitative variable)一般也称为连续变量,是由测量或计数、统计所得到的量,可以通过数值表达,并具有直接的数值含义。
定义 8.2 (定性变量) 定性变量(Qualitative variable)一般也称为分类变量,主要用于区分事物性质差异,往往用语义类别表达,没有直接的数值含义。
定义 8.3 (变量尺度) 变量尺度(Variable scale)刻画的是变量的数值含义或数值关系。它将意味着在数值含义和关系上,变量是有层次级别的差异性。根据变量层级不同,具体可以分为由低到高的4个层级: 名义尺度(nominal scale)变量:这类变量只用于属性分类,不具备任何数值含义或数值关系,也即不能加、减、乘、除,也不能比较大小。 序数尺度(order scale)变量:这类变量具备很少的数值含义或数值关系,它可以比较大小,但不能进行加、减、乘、除。 区间尺度(interval scale)变量:这类变量具备一定的数值含义或数值关系,它可以比较大小,也可以进行加、减,但不能进行乘、除。 比率尺度(ratio scale)变量:这类变量具备最多的数值含义或数值关系,它可以比较大小,也可以进行加、减、乘、除。
根据以上定义,区域经理年薪案例中,可以认为年薪\(salary\)、销售额\(sale\),以及客户评价\(score\)为定量变量,消费群体主要肤色\(race\)为定性变量。其中,从变量的度量尺度来看:
- 年薪\(salary\)和销售额\(sale\)两个变量为比率尺度变量
- 客户评价\(score\)变量为序数尺度变量
- 消费群体主要肤色\(race\)为名义尺度变量
8.2.1 如何把定性变量转换为虚拟变量?
一个定性变量的不同数据取值,称为该定性变量的属性。定性变量的任一属性,都可以设置为一个虚拟变量。实际上,我们可以用一套虚拟变量体系来完全表达一个定性变量。然后按照一定的规则构建虚拟变量回归模型,从而避免参数估计、模型解释等问题的出现。
定义 8.4 (虚拟变量) 对于某定性变量的任一特定属性,可以构造出一个虚拟变量(记为D),使得该虚拟变量能够表达这一属性。同时,给该虚拟变量D赋值为1,记为具备这一属性;给该虚拟变量赋值为0,记为不具备该属性。正式地,假设定性变量\(X\)具有\(m\)个属性\(a_1,a_2,\cdots,a_m\),对于任意属性\(k,(k\in{1,2,\cdots,m})\),可以定义如下的虚拟变量\(D_k\): \[\begin{equation} D_k= \begin{cases} 1, & \text{if } a_k\\ 0, & \text{if not } a_k \end{cases} \end{equation}\]
定义 8.5 (虚拟变量体系) 完整表达某个定性变量全部信息的一组虚拟变量。正式地,假设定性变量\(X\)具有\(m\)个属性\(a_1,a_2,\cdots,a_m\),可以用如下一组虚拟变量\(D_1,\cdots,D_k,\cdots,D_m\)完全表达该定性变量: \[\begin{align} X\{a_1,a_2,\cdots,a_m\} \Rightarrow \begin{cases} D_1 = \begin{cases} 1, & \text{if } a_1\\ 0, & \text{if not } a_1 \end{cases} \\ \vdots \\ D_k = \begin{cases} 1, & \text{if } a_k\\ 0, & \text{if not } a_k \end{cases} \\ \vdots\\ D_m = \begin{cases} 1, & \text{if } a_m\\ 0, & \text{if not } a_m \end{cases} \end{cases} \end{align}\]
区域经理年薪案例中,定性变量肤色(\(race\))具有3个属性(\(m=3\)),具体为\(X\{a_1=yellow,a_2=white,a_3=black\}\),则可以构造出如下的虚拟变量体系17。
\[\begin{align} race\{a_1=\text{yellow},a_2=\text{white},a_3=\text{black}\} \\ \Longrightarrow \begin{cases} race\_yellow = \begin{cases} 1, & \text{yellow}\\ 0, & \text{not yellow} \end{cases} \\ race\_white = \begin{cases} 1, & \text{white}\\ 0, & \text{not white} \end{cases} \\ race\_black = \begin{cases} 1, & \text{black}\\ 0, & \text{not black} \end{cases} \end{cases} \end{align}\]
实际数据操作中,一般需要对定性变量\(race\)进行重新编码(recode),生成三个对应的虚拟变量(见表8.2)。
staff | race | race_black | race_white | race_yellow |
---|---|---|---|---|
Zhang | yellow | 0 | 0 | 1 |
Tom | white | 0 | 1 | 0 |
Lee | yellow | 0 | 0 | 1 |
Jeff | white | 0 | 1 | 0 |
Kevin | black | 1 | 0 | 0 |
8.2.2 如何理解虚拟变量回归模型?
区域经理薪水案例中,如果不区分变量类型和特征,建议如下的回归模型(见方程(8.1)),则回归分析结果将会带来严重的问题。
\[\begin{equation} salary={\alpha}_1+{\alpha}_2race+{\alpha}_3sale+u \tag{8.1} \end{equation}\]
事实上,应该将上述模型转换为虚拟变量回归模型(如方程(8.2))。这类模型往往又被称为方差分析模型,其模型本质上是对不同“类型”或不同“分组”的均值水平(期望水平)进行比较和检验。
\[\begin{equation} salary={\beta}_1+{\beta}_2race\_yellow+{\beta}_3race\_white+{\beta}_4sale+u \tag{8.2} \end{equation}\]
很显然,在总体回归模型(8.2)下,可以得到所有3类“分组”情形下的期望年薪水平:
\[\begin{align} E(Y|race\_yellow=1,race\_white=0,sale)&=\beta_1+\beta_2+\beta_4sale &&\text{(market yellow)} \tag{8.3}\\ E(Y|race\_yellow=0,race\_white=1,sale)&=\beta_1+\beta_3 +\beta_4sale &&\text{(market white)} \tag{8.4}\\ E(Y|race\_yellow=0,race\_white=0,sale)&=\beta_1+\beta_4sale &&\text{(market black)} \tag{8.5}\\ \end{align}\]
对于模型(8.2),我们称其为有截距的含有虚拟变量的、加法形式的回归模型。显然,虚拟变量\(race\_{black}\)没有进入模型(8.2)中,且模型(8.2)设置有截距项\(\beta_1\)。在这种设定下,我们称:
同时,我们称:
- 有序变量\(rank\)为协变量(covariates)或控制变量(control variable)
- \(\beta_1\)为截距系数,代表基础组的期望水平
- \(\beta_2,\beta_3\)为极差系数,代表的是比较组与基础组期望水平的差距
- \(\beta_4\)为平行斜率系数,代表协变量的影响效应
8.2.3 虚拟变量陷进
在有截距的\(k\)元回归模型,经典线性回归模型假设(N-CLRM)中有一条要求:矩阵\(\boldsymbol{X}\)不能出现完全共线性,也即矩阵需要满足列满秩\(\rho(\boldsymbol{X})=k+1\)。
如果有两个定性变量,其中定性变量\(M_i\)的属性类别有\(m\)个;定性变量\(N_i\)的属性类别有\(n\)个。那么这两个定性变量分别可以转换为具有\(m\)和\(n\)个虚拟变量的体系。
如下设定的模型都将是不正确的:
(1)模型有截距项,任何一个定性变量的全部虚拟变量都进入模型。此时将出现虚拟变量陷进(完全共线性)。例如,\(M\_D1,M\_D2,\cdots, M\_D(m-1),M\_Dm\)全部进入模型。
(2)模型无截距项,任何一个定性变量的所有虚拟变量没有全部进入模型。此时,没有进入的群组将得不到模型表达。例如,定性变量\(M_i\)只有\(m-1\)个虚拟变量\(M\_D1,M\_D2,\cdots, M\_Dm-1\)进入模型。
相应地,如下设定的模型都是正确的:
(1)模型有截距项,全部定性变量的虚拟变量,都要丢弃一个虚拟变量,使其不进入模型。例如,定性变量\(M_i\)丢弃最后一个虚拟变量\(M\_Dm\),让\(m-1\)个虚拟变量\(M\_D1,M\_D2,\cdots, M\_Dm-1\)进入模型(当然,也可以丢弃全体虚拟变量的任何一个)。
(2)模型无截距项,任何一个定性变量的所有虚拟变量全部进入模型。例如,定性变量\(M_i\)的全部\(m\)个虚拟变量\(M\_D1,M\_D2,\cdots, M\_Dm-1, M\_Dm\)都进入模型。
温馨提示:在面板数据模型中(\(i \in (1,2,\cdots, 595); \quad t \in (1976, 1977,\cdots , 1982)\)),我们有时候会同时设定个体异质性的固定效应虚拟变量\(A_{it}\),以及时期的固定效应虚拟变量\(D_{it}\)。
此时正确设置虚拟变量模型的经验法则是:在包含一组个体固定效应的虚拟变量模型中,有必要删除整体常数项或其中一个固定效应。(请参看(Greene W H, 2018)pg.159)
此时虚拟变量陷进的关键在于:
\[\begin{align} \sum_{i=1}^{595} A_{i t}=\sum_{t=1976}^{1982} D_{i t} \end{align}\]
那么正确的虚拟变量模型设定可以是:
\[\begin{align} \begin{aligned} \ln \text { Wage }_{i t}=& \beta_{1}+\sum_{i=1}^{595} \alpha_{i} A_{i t}+\beta_{2} \operatorname{Exp}_{i t}+\beta_{3} \operatorname{Exp}_{i t}^{2}+\beta_{4} W k s_{i t}+\beta_{5} O c c_{i t}+\\ & \beta_{6} \operatorname{Ind}_{i t}+\beta_{7} \text { South }_{i t}+\beta_{8} \operatorname{SMSA}_{i t}+\beta_{9} M S_{i t}+\beta_{10} \text { Union }_{i t}+\\ & \beta_{11} E d_{i t}+\beta_{12} \text { Fem }_{i t}+\sum_{t=1977}^{1982} \gamma_{i t}+\varepsilon_{i t}, \end{aligned} \end{align}\]
以及:
\[\begin{align} \begin{aligned} \ln \text { Wage }_{i t}=& \sum_{i=1}^{595} \alpha_{i} A_{i t}+\beta_{2} \operatorname{Exp}_{i t}+\beta_{3} \operatorname{Exp}_{i t}^{2}+\beta_{4} \text { Wks }_{i t}+\beta_{5} \text { Occ }_{i t}+\beta_{6} \operatorname{Ind}_{i t}+\\ & \beta_{7} \text { South }_{i t}+\beta_{8} \text { SMSA }_{i t}+\beta_{9} M S_{i t}+\beta_{10} \text { Union }_{i t}+\beta_{11} E d_{i t}+\\ & \beta_{12} \text { Fem }_{i t}+\sum_{t=1977}^{1982} \gamma_{t} D_{i t}+\varepsilon_{i t} \end{aligned} \end{align}\]
事实上,要完全避免面板数据个体固定效应模型设定中的“虚拟变量陷进”,我们还需要进一步考虑到数据集本身。例如,在某些情况下(数据子集中)存在数值取值不变的“常变量”(invariant variables)。如在某个数据子集中,性别一直为女性。
此时,“虚拟变量陷进”的一般化表达是(请参看(Greene W H, 2018)pg.159):
“虚拟变量陷进”:在包含由一组\(N\)个虚拟变量表示的一组完整的\(N\)个个体效应的模型中,模型中的任何其他变量在每个时期对每个个体取相同的值都可以写成这些效应的线性组合。
例如,这个时候虚拟变量女性\(FEM_i\)就可以被写成个体效应虚拟变量\(A_{ij}\)的线性组合,从而表现出“虚拟变量陷进”(完全共线性)。那么模型设定中,就必须删掉虚拟变量女性\(FEM_i\)。当然,其他虚拟变量如教育\(ED_i\)也可能会出现类似的情况而必须从模型中删除。如果上述这些变量又十分重要,那么这样做就显得非常不符合模型的经济学含义。(那怎么办?一个办法是可以设置个体异质性固定效应模型,具体见(Greene W H, 2018) chapter 11 pg.396。)
例如,考虑到存在3个“常变量”(invariant variables)的固定效应虚拟变量模型,应该设定为:
\[\begin{align} \begin{aligned} \text { In Wage }_{i t} &=\alpha_{i}+\beta_{2} \operatorname{Exp}_{i t}+\beta_{3} \operatorname{Exp}_{i t}^{2}+\beta_{4} W k s_{i t}+\beta_{5} \text { Occ }_{i t} \\ &+\beta_{6} \text { Ind }_{i t}+\beta_{7} \text { South }_{i t}+\beta_{8} \text { SMSA }_{i t}+\beta_{9} M S_{i t} \\ &+\beta_{10} \text { Union }_{i t}+0 \times E d_{i}+0 \times F e m_{i}+0 \times B l k_{i}+\varepsilon_{i t} . \end{aligned} \end{align}\]
8.2.4 虚拟变量回归模型有哪些形式?
一个线性回归模型,只要回归元中包含了虚拟变量,这种模型就被称为虚拟变量回归模型,也可以称为方差分析模型 (Analysis of variance, ANOVA)18。
根据回归元包含定量变量和虚拟变量的数量关系,可以将虚拟变量回归模型分为:
- 只含有虚拟变量的回归模型:全部解释变量都是由虚拟变量构成
- 同时含有虚拟变量和定量变量的回归模型:解释变量同时含有虚拟变量和定量变量
根据虚拟变量引入模型方式的不同,可以划分为:
- 加法模型:虚拟变量以独立项的形式出现在方程中
- 乘法模型:虚拟变量以交叉项的形式出现在方程中
- 混合模型:虚拟变量以独立项和/或交叉项的形式出现在方程中19
- 完全混合模型
- 部分混合模型
根据虚拟变量模型是否参照基础组,可以划分为20:
- 有截距模型:此时模型解释中将有明确的基础组,其他组可以直接与之参照对比。
- 无截距模型:此时模型解释中将没有明确的基础组,各组间将不直接参照对比。
根据模型中的因变量\(Y\)是否取对数,可以划分为21:
- 经典线性模型:因变量为\(Y\)
- 半对数模型:因变量为\(ln(Y)\)
根据虚拟变量模型应用情景的不同,可以划分为:
- 截面数据虚拟变量回归模型:此时虚拟变量用于表达回归元为定性变量的情形
- 时间序列季节虚拟变量回归模型:此时虚拟变量用于表达季节周期(具体请参看节8.5.5)
- 分段线性虚拟变量回归模型:此时虚拟变量用于表达阀值分段(具体请参看节8.5.6)
对于具体的实证分析案例,我们往往需要根据变量的属性和特征,构建不同类型的虚拟变量回归模型,比较不同模型的回归分析结果,甄选并得到其中相对理想的模型。显然,不同类型的虚拟变量模型设置,具有不同的经济学含义。甚至回归方程系数解读的直观性,模型构建意图表达的直接性等,也存在较大差异,都需要对各种备选的、可行的模型进行反复测试和甄选。
例如,仅是考虑基础组的有截距模型,可能用到的各类备选组合模型至少包括(具体回归方程设置见节8.5.3和节8.5.4):
- 只含有虚拟变量的、加法形式的经典回归模型
- 只含有虚拟变量的、加法形式的半对数回归模型
- 只含有虚拟变量的、乘法形式的经典回归模型
- 只含有虚拟变量的、乘法形式的半对数回归模型
- \(\cdots\)
- 同时含有虚拟变量和定量变量的、加法形式的经典回归模型
- 同时含有虚拟变量和定量变量的、加法形式的半对数回归模型
- 同时含有虚拟变量和定量变量的、乘法形式的经典回归模型
- 同时含有虚拟变量和定量变量的、乘法形式的半对数回归模型
- \(\cdots\)
8.3 实验内容
将定性变量都处理成完全虚拟变量体系(也即定性变量有m个属性,则设置m个虚拟变量)
分析只含有虚拟变量的回归模型(有截距)
- 只含有虚拟变量的、加法形式的经典回归模型
- 只含有虚拟变量的、加法形式的半对数回归模型
- 只含有虚拟变量的、乘法形式的经典回归模型
- 只含有虚拟变量的、乘法形式的半对数回归模型
分析同时含有虚拟变量和定量变量的回归模型(有截距):
- 同时含有虚拟变量和定量变量的、加法形式的经典回归模型
- 同时含有虚拟变量和定量变量的、加法形式的半对数回归模型
- 同时含有虚拟变量和定量变量的、乘法形式的经典回归模型
- 同时含有虚拟变量和定量变量的、乘法形式的半对数回归模型
分析时间序列季节虚拟变量模型
分析分段线性回归模型(piecewise linear regression)
8.4 实验准备
8.4.1 实验软件
本次实验需要提前准备好如下软件:
- 统计分析软件Eviews 9.0版本及以上
- 公式编辑软件Mathtype 6.0版本及以上
- 写作编辑软件Office Word/Excel 2010版本及以上
- 浏览器软件chrome 66.0版本及以上或 360极速浏览器9.5版本及以上
8.4.2 实验材料
印度工人工资:本次实验将使用表8.3给出的114位印度工人在wage工人工资,age年龄,edu教育水平,dpt合同类型,sex性别等方面的数据。
obs | wage | age | edu | dpt | sex |
---|---|---|---|---|---|
1 | 117.00 | 26 | pri | per | f |
2 | 375.00 | 42 | pri | per | f |
3 | 175.00 | 33 | pri | per | f |
4 | 100.00 | 33 | pri | per | f |
5 | 162.50 | 30 | pri | per | f |
110 | 25.00 | 18 | ill | tem | m |
111 | 25.00 | 11 | ill | tem | m |
112 | 75.00 | 45 | ill | tem | m |
113 | 53.84 | 14 | ill | tem | m |
114 | 50.00 | 26 | ill | tem | m |
变量说明见表8.4:
variable | label | remark |
---|---|---|
obs | 工人编号 | 序号(observations) |
wage | 工人工资 | 美元/周($/week) |
age | 年龄 | 岁(year) |
edu | 教育水平 | ill=文盲(illiteracy);pri=初等教育(primary);mid=中等教育(middle);hig=高等教育(higher) |
dpt | 合同类型 | tem=短期合同(temporary);per=长期合同(permanent) |
sex | 性别 | f=女(female);m=男(male) |
8.4.3 实验规则
8.4.3.1 模型及参数命名规则
本次实验将对不同组合下的多个模型进行比较分析,我们对这些不同模型及参数做如下约定:
- 不同虚拟变量体系命名,依次以希腊字母体系\(\{\alpha_1,\alpha_2,\cdots\};\{\beta_1,\beta_2,\cdots\};\{\gamma_1,\gamma_2,\cdots\};\cdots\)表达
- 定量变量参数的命名,依次以希腊字母\(\delta_1;\delta_2;\cdots\)表达
- 虚拟变量交叉项的参数命名,依次以希腊字母\(\lambda_1;\lambda_2;\cdots\)表达
例如,同时含有虚拟变量和定量变量的、乘法形式的、经典线性的、完全变量引入回归模型(eq_both_pro_ord_full)
\[\begin{equation} \begin{split} wage_i & =\alpha_1+\alpha_2edu_{D2,i}+\alpha_3edu_{D3,i}+\alpha_4edu_{D4,i}+\beta_2 dpt_{D2,i}+\gamma_2sex_{D2,i}+\delta age_i \\ & +\lambda_2edu_{D2,i} \ast dpt_{D2,i}+\lambda_3edu_{D3,i}\ast dpt_{D2,i} +\lambda_4edu_{D4,i}\ast dpt_{D2,i}+u_i \end{split} \end{equation}\]
8.4.3.2 Eviews对象命名规则
因为案例模型涉及到多个定性变量和定量变量,同时还考虑对不同组合下的多个模型进行比较分析,为了记忆和分析方便,我们约定如下的Eviews对象命名规则:
- 虚拟变量序列对象(Series)
的命名规则:
- 定性变量的属性命名:确定基础组,例如本例中的基础组为{文盲,短期合同,女性}(也即{illiteracy,temporary,female}),并将各个定性变量的基础组属性都命名为\(D_1\)虚拟变量,其他比较组属性则依次命名为\(D_2,D_3,\cdots\)。
- 虚拟变量体系命名:对于一个定性变量,应完全表达为虚拟变量体系,且以定性变量名+虚拟变量记号的方式命名。
例如,教育水平定性变量\(edu(m=4)\),应设置为4个虚拟变量定性edu_D1、
edu_D2、
edu_D3、
edu_D4。
- 方程对象(Equation)
的命名规则:
- only,表示只含有虚拟变量的回归方程
- both,表示同时含有虚拟变量和定量变量的回归方程
- plus,表示加法形式(plus)的回归方程
- prod,表示乘法形式(product)的回归方程
- ord,表示因变量为普通形态\(Y\)的回归方程
- log,表示因变量为对数形态\(ln(Y)\)的回归方程
- full,表示一个定性变量的虚拟变量与另一个变量的全部交叉项,以及该定性变量的虚拟变量的独立项,全部进入回归方程。例如,有截距模型下(考虑基础组),教育水平定性变量\(edu(m=4)\)与工作类型定性变量\(dpt(m=2)\)的交叉项\(edu_{D2}*dpt_{D2}\)、\(edu_{D3}*dpt_{D2}\)和\(edu_{D4}*dpt_{D2}\),以及独立项\(edu_{D2}\)、\(edu_{D3}\)和\(edu_{D4}\),全部进入回归方程。
- part,表示一个定性变量的虚拟变量与另一个变量的全部交叉项进入回归方程,但是该定性变量的虚拟变量的独立项不进入回归方程。例如,有截距模型下(考虑基础组),教育水平定性变量\(edu(m=4)\)与工作类型定性变量\(dpt(m=2)\)的交叉项\(edu_{D2}*dpt_{D2}\)、\(edu_{D3}*dpt_{D2}\)和\(edu_{D4}*dpt_{D2}\)进入回归方程,但其独立项\(edu_{D2}\)、\(edu_{D3}\)和\(edu_{D4}\)并不引入回归方程中。
例如,方程对象eq_only_plus_log_full,代表只含有虚拟变量的、加法形式的、对数化的、全部变量进入的回归方程。
8.5 主要实验步骤
8.5.1 导入数据并进行预处理
- 目标:构建工作文件并正确导入数据
- 思路:数据结构为
unstructured/undatede
- 新建Eviews工作文件(见图8.1)
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y
- Eviews菜单操作:
- 依次操作:File\(\Rightarrow\)New\(\Rightarrow\)Workfile
- 进行workfile create引导设置:
- workfile structure type:
unstructured/undatede
- data range:114
- workfile names(optional):
- WF:
worker
(建议命名) - Page:
indian
(建议命名)
- WF:
- workfile structure type:
- Eviews导入数据
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y数据(X数据所有同学都一样)
- 菜单操作(Excel和Eviews):
- Excel找到数据。Excel表格中仅保留自己需要的数据(obs, wage, age, edu, dpt, sex)
- Eviews导入数据。File\(\Rightarrow\)Import\(\Rightarrow\)Import From File:
d:/econometrics/data/Lab8-indian-wage.xlsx
- 提示:Excel数据,每个同学的Y数据都不同,找到自己学号对应下的Y数据(X数据所有同学都一样)

图 8.1: 导入数据的Eviews视窗
8.5.2 把定性变量设置成虚拟变量体系
目标:学会用一套虚拟变量体系来完整表达一个定性变量
思路:按照完备、互斥的法则设置虚拟变量;如果要设置有截距模型,应统筹、优先考虑基础组的虚拟变量设置。
Eviews操作:
- 把定性变量教育水平edu(m=4)设置成虚拟变量体系。(具体操作见图8.2)
- 命令视窗(Command)依次输入命令(建议分别命名为edu_ill、edu_pri、edu_mid和edu_hig)
series edu_ill=@recode(edu="ill",1,0)'
series edu_pri=@recode(edu="pri",1,0)'
series edu_mid=@recode(edu="mid",1,0)
series edu_hig=@recode(edu="hig",1,0)'
- 运行命令:命令行中按Enter键
- 查看结果(以组group的形式查看):
- 按住键盘Ctrl+依次点击
edu
、edu_ill
、edu_pri
、edu_mid
、edu_hig
- 点击鼠标右键\(\Rightarrow\) Open \(\Rightarrow\) as Group
- 按住键盘Ctrl+依次点击
- 命令视窗(Command)依次输入命令(建议分别命名为edu_ill、edu_pri、edu_mid和edu_hig)
- 把定性变量合同类型dpt(m=2)设置成虚拟变量体系。(具体操作见图8.3)
- 命令视窗(Command)依次输入命令(建议分别命名为dpt_tem和dpt_per)
series dpt_tem=@recode(dpt="tem",1,0)'
series dpt_per=@recode(dpt="per",1,0)
- 运行命令:命令行中按Enter键
- 查看结果(以组group的形式查看):
- 按住键盘Ctrl+依次点击
dpt
、dpt_tem
、dpt_per
- 点击鼠标右键\(\Rightarrow\) Open \(\Rightarrow\) as Group
- 按住键盘Ctrl+依次点击
- 命令视窗(Command)依次输入命令(建议分别命名为dpt_tem和dpt_per)
- 把定性变量性别sex(m=2)设置成虚拟变量体系。(具体操作见图8.4)
- 命令视窗(Command)依次输入命令(建议分别命名为sex_f和sex_m)
series sex_f=@recode(sex="f",1,0)'
series sex_m=@recode(sex="m",1,0)
- 运行命令:命令行中按Enter键
- 查看结果(以组group的形式查看):
- 按住键盘Ctrl+依次点击
sex
、sex_f
、sex_m
- 点击鼠标右键\(\Rightarrow\) Open \(\Rightarrow\) as Group
- 按住键盘Ctrl+依次点击
- 命令视窗(Command)依次输入命令(建议分别命名为sex_f和sex_m)
- 说明(Eviews代码行的解读)22:
- 代码
series edu_ill=@recode(edu="ill",1,0)
表示给创建一个序列(Series)对象edu_ill
,并对定性变量对象edu
进行重新编码处理(recode),并把重新编码处理后的数值赋值给序列(Series)对象edu_ill
。 - 代码
@recode(edu="ill",1,0)
表示对定性变量对象edu
进行重新编码处理。具体做法是,如果edu
的取值为ill
,则相应赋值为1,或者就相应赋值为0。
- 代码
- 把定性变量教育水平edu(m=4)设置成虚拟变量体系。(具体操作见图8.2)

图 8.2: 定性变量edu用虚拟变量体系表达

图 8.3: 定性变量dpt用虚拟变量体系表达

图 8.4: 定性变量sex用虚拟变量体系表达
8.5.2.1 操作解读
实际操作中,我们首先要对定性变量进行重新编码,设置成各自的虚拟变量体系。Eviews中对定性变量重新编码为虚拟变量的代码函数为@recode()
。我们可以事先将一个定性变量完全地进行虚拟变量编码23。也就是说,如果一个定性变量有m个属性,我们可以直接设置m个虚拟变量。
此外,便于后续多个模型的分析甄选,我们还应该进一步统一设计虚拟变量的名称、命名的顺序等。例如,假设后续的备选模型中将基础组设定为{文盲,临时工,女性}(也即{illiteracy,temporary,female})24。则可以将全部定性变量的基础组属性{illiteracy,temporary,female}分别设置为虚拟变量edu_ill
(见表8.5)、dpt_tem
(见表8.6)和sex_f
(见表8.7)。
obs | edu | edu_ill | edu_pri | edu_mid | edu_hig |
---|---|---|---|---|---|
1 | pri | 0 | 1 | 0 | 0 |
2 | pri | 0 | 1 | 0 | 0 |
6 | mid | 0 | 0 | 1 | 0 |
7 | mid | 0 | 0 | 1 | 0 |
92 | hig | 0 | 0 | 0 | 1 |
93 | hig | 0 | 0 | 0 | 1 |
113 | ill | 1 | 0 | 0 | 0 |
114 | ill | 1 | 0 | 0 | 0 |
obs | dpt | dpt_tem | dpt_per |
---|---|---|---|
1 | per | 0 | 1 |
2 | per | 0 | 1 |
3 | per | 0 | 1 |
4 | per | 0 | 1 |
111 | tem | 1 | 0 |
112 | tem | 1 | 0 |
113 | tem | 1 | 0 |
114 | tem | 1 | 0 |
obs | sex | sex_f | sex_m |
---|---|---|---|
1 | f | 1 | 0 |
2 | f | 1 | 0 |
3 | f | 1 | 0 |
4 | f | 1 | 0 |
111 | m | 0 | 1 |
112 | m | 0 | 1 |
113 | m | 0 | 1 |
114 | m | 0 | 1 |
8.5.3 只含有虚拟变量的回归模型(考虑基础组的情形)
8.5.3.1 加法模型
目标:把定性变量的虚拟变量以独立项的形式引入模型方程,解释回归报告
思路:确定基础组,设置总体回归模型(PRM),进行OLS估计,得到Eviews分析报告
理论提示:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}&& + \beta_{6} sex_{m}&&+u\\ \end{alignedat} \tag{8.6} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}&& + \beta_{6} sex_{m}&&+u\\ \end{alignedat} \tag{8.7} \end{equation}\]
- Eviews操作1(只含有虚拟变量的、加法形式的经典回归模型见方程(8.6),菜单操作实现具体见图8.5):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_ill
dpt_tem
sex_f
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
wage c edu_pri edu_mid edu_hig dpt_per sex_m
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_only_plus
) - 查看结果:双击
eq_only_plus
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.6:

图 8.5: 只含虚拟变量的、加法形式的经典线性回归模型Eviews实现

图 8.6: 只含虚拟变量的、加法形式的经典线性回归模型Eviews报告
- Eviews操作2(只含有虚拟变量的、加法形式的半对数回归模型见方程(8.7),菜单操作实现具体见图8.7):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_ill
dpt_tem
sex_f
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
log(wage) c edu_pri edu_mid edu_hig dpt_per sex_m
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_only_plus_log
) - 查看结果:双击
eq_only_plus_log
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.8:

图 8.7: 只含虚拟变量的、加法形式的半对数线性回归模型Eviews实现

图 8.8: 只含虚拟变量的、加法形式的半对数线性回归模型Eviews报告
8.5.3.1.1 报告解读
只含虚拟变量的、加法形式的经典回归模型Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}\\ &\text{(cont.)}&& + \beta_{5} dpt_{per}&& + \beta_{6} sex_{m}&&+u\\ \end{alignedat} \tag{8.8} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+130.36&&+10.47edu_{pri}&&+49.71edu_{mid}&&+162.59edu_{hig}\\ &\text{(t)}&&(7.3397)&&(0.3126)&&(1.4818)&&(2.9944)\\ &\text{(se)}&&(17.7609)&&(33.4850)&&(33.5470)&&(54.2989)\\ &\text{(cont.)}&&+59.37dpt_{per}&&-106.49sex_{m}\\ &\text{(t)}&&(2.3899)&&(-3.7005)\\ &\text{(se)}&&(24.8399)&&(28.7784)\\ &\text{(fitness)}&& n=114;&& R^2=0.2204;&& \bar{R^2}=0.1843\\ & && F^{\ast}=6.11;&& p=0.0001\\ \end{alignedat} \tag{8.9} \end{equation}\]
此时,根据总体回归模型(8.8)和样本回归方程(8.9)我们可以得到:
- 基础组(文盲 & 短期合同 & 女性),也即(illiteracy & temporary & female)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(0)\\=&+\beta_{1}\\\end{split}\tag{8.10}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(0)+\hat{\beta}_{6}(0)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(0)\\ &+[59.37]\cdot(0)+[-106.49]\cdot(0)\\ =&130.3594\\ \end{split} \tag{8.11} \end{align}\]
- 比较组1(文盲 & 短期合同 & 男性),也即(illiteracy & temporary & male)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=1)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(1)\\=&+\beta_{1}+\beta_{6}\\\end{split}\tag{8.12}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=1)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(0)+\hat{\beta}_{6}(1)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(0)\\ &+[59.37]\cdot(0)+[-106.49]\cdot(1)\\ =&23.8656\\ \end{split} \tag{8.13} \end{align}\]
- 比较组2(高等教育 & 长期合同 & 男性),也即(higher & permanent & male)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=1;dpt_{per}=1;sex_{m}=1)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(1)+\beta_{5}(1)+\beta_{6}(1)\\=&+\beta_{1}+\beta_{4}+\beta_{5}+\beta_{6}\\\end{split}\tag{8.14}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=1;dpt_{per}=1;sex_{m}=1)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(1)\\ &+\hat{\beta}_{5}(1)+\hat{\beta}_{6}(1)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(1)\\ &+[59.37]\cdot(1)+[-106.49]\cdot(1)\\ =&245.8224\\ \end{split} \tag{8.15} \end{align}\]
只含虚拟变量的、加法形式的半对数回归模型Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &\widehat{log(wage)}=&&+4.53&&+0.06edu_{pri}&&+0.42edu_{mid}&&+0.71edu_{hig}\\ &\text{(t)}&&(44.7474)&&(0.3045)&&(2.1853)&&(2.2995)\\ &\text{(se)}&&(0.1012)&&(0.1909)&&(0.1912)&&(0.3095)\\ &\text{(cont.)}&&+0.53dpt_{per}&&-0.84sex_{m}\\ &\text{(t)}&&(3.7187)&&(-5.1040)\\ &\text{(se)}&&(0.1416)&&(0.1640)\\ &\text{(fitness)}&& n=114;&& R^2=0.3176;&& \bar{R^2}=0.2860\\ & && F^{\ast}=10.05;&& p=0.0000\\ \end{alignedat} \tag{8.16} \end{equation}\]
给定不同的显著性水平\(\alpha=0.1;\alpha=0.05;\alpha=0.01\),t分布和F分布的理论查表值分别为:
8.5.3.2 乘法模型
目标:把定性变量的虚拟变量以交叉项的形式引入模型方程,解释回归报告
思路:确定基础组,设置总体回归模型(PRM),进行OLS估计,得到Eviews分析报告
理论提示:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} edu_{pri}&& + \beta_{4} edu_{mid}\\ &\text{(cont.)}&& + \beta_{5} edu_{hig}&& + \beta_{6} dpt_{per}&& + \beta_{7} edu_{pri} \ast dpt_{per}&& + \beta_{8} edu_{mid} \ast dpt_{per}\\ &\text{(cont.)}&& + \beta_{9} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.17} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} dpt_{per} \ast edu_{pri}\\ &\text{(cont.)}&& + \beta_{5} dpt_{per} \ast edu_{mid}&& + \beta_{6} dpt_{per} \ast edu_{hig}&&+u\\ \end{alignedat} \tag{8.18} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} dpt_{per} \ast edu_{pri}\\ &\text{(cont.)}&& + \beta_{5} dpt_{per} \ast edu_{mid}&& + \beta_{6} dpt_{per} \ast edu_{hig}&&+u\\ \end{alignedat} \tag{8.19} \end{equation}\]
- Eviews操作1(只含有虚拟变量的、乘法形式的经典回归模型见方程(8.17),菜单操作实现具体见图8.9):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
wage c edu_d2 edu_d3 edu_d4 dpt_d2 sex_d2 edu_d2*dpt_d2 edu_d3*dpt_d2 edu_d4*dpt_d2
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_only_prod
) - 查看结果:双击
eq_only_prod
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.10:

图 8.9: 只含虚拟变量的、乘法形式的经典线性回归模型Eviews实现

图 8.10: 只含虚拟变量的、乘法形式的经典线性回归模型Eviews报告
- Eviews操作2(只含有虚拟变量的、乘法形式的半对数回归模型见方程(8.19),菜单操作实现具体见图8.11):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
log(wage) c dpt_d2 sex_d2 edu_d2*dpt_d2 edu_d3*dpt_d2 edu_d4*dpt_d2
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_only_prod_log_part
) - 查看结果:双击
eq_only_prod_log_part
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.12:

图 8.11: 只含虚拟变量的、乘法形式的半对数线性回归模型Eviews实现

图 8.12: 只含虚拟变量的、乘法形式的半对数线性回归模型Eviews报告
8.5.3.2.1 报告解读
只含虚拟变量的、乘法形式的经典回归模型(全部变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} edu_{pri}&& + \beta_{4} edu_{mid}&& + \beta_{5} edu_{hig}\\ &\text{(cont.)}&& + \beta_{6} dpt_{per}&& + \beta_{7} edu_{pri} \ast dpt_{per}&& + \beta_{8} edu_{mid} \ast dpt_{per}&& + \beta_{9} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.20} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+120.70&&-88.19sex_{m}&&+23.03edu_{pri}&&+13.72edu_{mid}&&+829.30edu_{hig}\\ &\text{(t)}&&(7.9082)&&(-3.6975)&&(0.7060)&&(0.3895)&&(8.0985)\\ &\text{(se)}&&(15.2625)&&(23.8515)&&(32.6264)&&(35.2241)&&(102.4020)\\ &\text{(cont.)}&&+74.78dpt_{per}&&-32.62edu_{pri} \ast dpt_{per}&&+90.22edu_{mid} \ast dpt_{per}&&-814.86edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.9864)&&(-0.5459)&&(1.6171)&&(-7.1313)\\ &\text{(se)}&&(25.0404)&&(59.7485)&&(55.7896)&&(114.2653)\\ &\text{(fitness)}&& n=114;&& R^2=0.4925;&& \bar{R^2}=0.4538\\ & && F^{\ast}=12.74;&& p=0.0000\\ \end{alignedat} \tag{8.21} \end{equation}\]
此时,根据总体回归模型(8.20)和样本回归方程(8.21)我们可以得到:
- 基础组(文盲 & 短期合同 & 女性),也即(illiteracy & temporary & female)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(0)\\&+\beta_{7}(0)\cdot(0)+\beta_{8}(0)\cdot(0)+\beta_{9}(0)\cdot(0)\\=&+\beta_{1}\\&\\\end{split}\tag{8.22}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=0;sex_{m}=0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(0)+\hat{\beta}_{6}(0)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(0)\\ &+[59.37]\cdot(0)+[-106.49]\cdot(0)\\ =&130.3594\\ \end{split} \tag{8.23} \end{align}\]
- 比较组1(文盲 & 长期合同 & 女性),也即(illiteracy & temporary & male)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=1;sex_{m}=0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(1)\\&+\beta_{7}(0)\cdot(1)+\beta_{8}(0)\cdot(1)+\beta_{9}(0)\cdot(1)\\=&+\beta_{1}+\beta_{6}\\&\\\end{split}\tag{8.24}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=1;sex_{m}=0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(1)+\hat{\beta}_{6}(0)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(0)\\ &+[59.37]\cdot(1)+[-106.49]\cdot(0)\\ =&189.7252\\ \end{split} \tag{8.25} \end{align}\]
- 比较组2(高等教育 & 长期合同 & 女性),也即(higher & permanent & male)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=1;sex_{m}=1)\\=&+\beta_{1}+\beta_{2}(1)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(1)\\&+\beta_{7}(0)\cdot(1)+\beta_{8}(0)\cdot(1)+\beta_{9}(0)\cdot(1)\\=&+\beta_{1}+\beta_{2}+\beta_{6}\\&\\\end{split}\tag{8.26}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|edu_{pri}=0;edu_{mid}=0;edu_{hig}=0;dpt_{per}=1;sex_{m}=1)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(1)+\hat{\beta}_{6}(1)\\ =&+[130.36]+[10.47]\cdot(0)+[49.71]\cdot(0)+[162.59]\cdot(0)\\ &+[59.37]\cdot(1)+[-106.49]\cdot(1)\\ =&83.2314\\ \end{split} \tag{8.27} \end{align}\]
只含虚拟变量的、乘法形式的经典回归模型(部分变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} dpt_{per} \ast edu_{pri}&& + \beta_{5} dpt_{per} \ast edu_{mid}\\ &\text{(cont.)}&& + \beta_{6} dpt_{per} \ast edu_{hig}&&+u\\ \end{alignedat} \tag{8.28} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+120.70&&-88.19sex_{m}&&+23.03edu_{pri}&&+13.72edu_{mid}&&+829.30edu_{hig}\\ &\text{(t)}&&(7.9082)&&(-3.6975)&&(0.7060)&&(0.3895)&&(8.0985)\\ &\text{(se)}&&(15.2625)&&(23.8515)&&(32.6264)&&(35.2241)&&(102.4020)\\ &\text{(cont.)}&&+74.78dpt_{per}&&-32.62edu_{pri} \ast dpt_{per}&&+90.22edu_{mid} \ast dpt_{per}&&-814.86edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.9864)&&(-0.5459)&&(1.6171)&&(-7.1313)\\ &\text{(se)}&&(25.0404)&&(59.7485)&&(55.7896)&&(114.2653)\\ &\text{(fitness)}&& n=114;&& R^2=0.4925;&& \bar{R^2}=0.4538\\ & && F^{\ast}=12.74;&& p=0.0000\\ \end{alignedat} \tag{8.29} \end{equation}\]
只含虚拟变量的、乘法形式的半对数回归模型(部分变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} dpt_{per} \ast edu_{pri}&& + \beta_{5} dpt_{per} \ast edu_{mid}\\ &\text{(cont.)}&& + \beta_{6} dpt_{per} \ast edu_{hig}&&+u\\ \end{alignedat} \tag{8.30} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+120.70&&-88.19sex_{m}&&+23.03edu_{pri}&&+13.72edu_{mid}&&+829.30edu_{hig}\\ &\text{(t)}&&(7.9082)&&(-3.6975)&&(0.7060)&&(0.3895)&&(8.0985)\\ &\text{(se)}&&(15.2625)&&(23.8515)&&(32.6264)&&(35.2241)&&(102.4020)\\ &\text{(cont.)}&&+74.78dpt_{per}&&-32.62edu_{pri} \ast dpt_{per}&&+90.22edu_{mid} \ast dpt_{per}&&-814.86edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.9864)&&(-0.5459)&&(1.6171)&&(-7.1313)\\ &\text{(se)}&&(25.0404)&&(59.7485)&&(55.7896)&&(114.2653)\\ &\text{(fitness)}&& n=114;&& R^2=0.4925;&& \bar{R^2}=0.4538\\ & && F^{\ast}=12.74;&& p=0.0000\\ \end{alignedat} \tag{8.31} \end{equation}\]
8.5.4 同时含有虚拟变量和定量变量的回归模型(考虑基础组的情形)
8.5.4.1 加法模型
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}&& + \beta_{6} sex_{m}&& + \beta_{7} age&&+u\\ \end{alignedat} \tag{8.32} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}&& + \beta_{6} sex_{m}&& + \beta_{7} age&&+u\\ \end{alignedat} \tag{8.33} \end{equation}\]
- Eviews操作1(同时含有虚拟变量和定量变量的、加法形式的经典回归模型见方程(8.32),菜单操作实现具体见图8.13):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
wage c edu_d2 edu_d3 edu_d4 dpt_d2 sex_d2 age
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_both_plus
) - 查看结果:双击
eq_both_plus
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.14:

图 8.13: 同时含虚拟变量和定量变量的、加法形式的经典线性回归模型Eviews实现

图 8.14: 同时含虚拟变量和定量变量的、加法形式的经典线性回归模型Eviews报告
- Eviews操作2(同时含有虚拟变量和定量变量的、加法形式的半对数回归模型见方程(8.33),菜单操作实现具体见图8.15):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
log(wage) c edu_d2 edu_d3 edu_d4 dpt_d2 sex_d2 age
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_both_plus_log
) - 查看结果:双击
eq_both_plus_log
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.16:

图 8.15: 同时含虚拟变量和定量变量的、加法形式的半对数线性回归模型Eviews实现

图 8.16: 同时含虚拟变量和定量变量的、加法形式的半对数线性回归模型Eviews报告
8.5.4.1.1 报告解读
同时含虚拟变量和定量变量的、加法形式的经典回归模型Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} sex_{m}&& + \beta_{7} age&&+u\\ \end{alignedat} \tag{8.34} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+130.36&&+10.47edu_{pri}&&+49.71edu_{mid}&&+162.59edu_{hig}&&+59.37dpt_{per}\\ &\text{(t)}&&(7.3397)&&(0.3126)&&(1.4818)&&(2.9944)&&(2.3899)\\ &\text{(se)}&&(17.7609)&&(33.4850)&&(33.5470)&&(54.2989)&&(24.8399)\\ &\text{(cont.)}&&-106.49sex_{m}\\ &\text{(t)}&&(-3.7005)\\ &\text{(se)}&&(28.7784)\\ &\text{(fitness)}&& n=114;&& R^2=0.2204;&& \bar{R^2}=0.1843\\ & && F^{\ast}=6.11;&& p=0.0001\\ \end{alignedat} \tag{8.35} \end{equation}\]
此时,根据总体回归模型(8.34)和样本回归方程(8.35)我们可以得到:
- 基础组(文盲 & 短期合同 & 女性),也即(illiteracy & temporary & female)的期望工资收入为(年龄为30岁):
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(0)\\&+\beta_{7}(30)\\=&+\beta_{1}\\&+30\beta_{7}\\\end{split}\tag{8.36}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(0)+\hat{\beta}_{6}(0)+\hat{\beta}_{7}(30)\\ =&+[6.79]+[23.96]\cdot(0)+[61.59]\cdot(0)+[150.49]\cdot(0)\\ &+[31.16]\cdot(0)+[-83.20]\cdot(0)+[3.99]\cdot(30)\\ =&126.4104\\ \end{split} \tag{8.37} \end{align}\]
- 比较组1(文盲 & 短期合同 & 男性),也即(illiteracy & temporary & male)的期望工资收入为(年龄为30岁):
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 1)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(1)\\&+\beta_{7}(30)\\=&+\beta_{1}+\beta_{6}\\&+30\beta_{7}\\\end{split}\tag{8.38}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 1)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)\\ &+\hat{\beta}_{5}(0)+\hat{\beta}_{6}(1)+\hat{\beta}_{7}(30)\\ =&+[6.79]+[23.96]\cdot(0)+[61.59]\cdot(0)+[150.49]\cdot(0)\\ &+[31.16]\cdot(0)+[-83.20]\cdot(1)+[3.99]\cdot(30)\\ =&43.2056\\ \end{split} \tag{8.39} \end{align}\]
- 比较组2(高等教育 & 长期合同 & 男性),也即(higher & permanent & male)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 1;dpt_{per}= 1;sex_{m}= 1)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(1)+\beta_{5}(1)+\beta_{6}(1)\\&+\beta_{7}(30)\\=&+\beta_{1}+\beta_{4}+\beta_{5}+\beta_{6}\\&+30\beta_{7}\\\end{split}\tag{8.40}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 1;dpt_{per}= 1;sex_{m}= 1)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(1)\\ &+\hat{\beta}_{5}(1)+\hat{\beta}_{6}(1)+\hat{\beta}_{7}(30)\\ =&+[6.79]+[23.96]\cdot(0)+[61.59]\cdot(0)+[150.49]\cdot(1)\\ &+[31.16]\cdot(1)+[-83.20]\cdot(1)+[3.99]\cdot(30)\\ =&224.8556\\ \end{split} \tag{8.41} \end{align}\]
同时含虚拟变量和定量变量的、加法形式的半对数回归模型Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} edu_{pri}&& + \beta_{3} edu_{mid}&& + \beta_{4} edu_{hig}&& + \beta_{5} dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} sex_{m}&& + \beta_{7} age&&+u\\ \end{alignedat} \tag{8.42} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+120.70&&-88.19sex_{m}&&+23.03edu_{pri}&&+13.72edu_{mid}&&+829.30edu_{hig}\\ &\text{(t)}&&(7.9082)&&(-3.6975)&&(0.7060)&&(0.3895)&&(8.0985)\\ &\text{(se)}&&(15.2625)&&(23.8515)&&(32.6264)&&(35.2241)&&(102.4020)\\ &\text{(cont.)}&&+74.78dpt_{per}&&-32.62edu_{pri} \ast dpt_{per}&&+90.22edu_{mid} \ast dpt_{per}&&-814.86edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.9864)&&(-0.5459)&&(1.6171)&&(-7.1313)\\ &\text{(se)}&&(25.0404)&&(59.7485)&&(55.7896)&&(114.2653)\\ &\text{(fitness)}&& n=114;&& R^2=0.4925;&& \bar{R^2}=0.4538\\ & && F^{\ast}=12.74;&& p=0.0000\\ \end{alignedat} \tag{8.43} \end{equation}\]
8.5.4.2 乘法模型
- 理论提示:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} edu_{pri}&& + \beta_{4} edu_{mid}&& + \beta_{5} edu_{hig}\\ &\text{(cont.)}&& + \beta_{6} dpt_{per}&& + \beta_{7} age&& + \beta_{8} edu_{pri} \ast dpt_{per}&& + \beta_{9} edu_{mid} \ast dpt_{per}&& + \beta_{10} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.44} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} age&& + \beta_{5} edu_{pri} \ast dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} edu_{mid} \ast dpt_{per}&& + \beta_{7} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.45} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} age&& + \beta_{5} edu_{pri} \ast dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} edu_{mid} \ast dpt_{per}&& + \beta_{7} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.46} \end{equation}\]
- Eviews操作1(同时含有虚拟变量和定量变量的、乘法形式的经典回归模型见方程(8.44),菜单操作实现具体见图8.17):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
wage c edu_d2 edu_d3 edu_d4 dpt_d2 sex_d2 age edu_d2*dpt_d2 edu_d3*dpt_d2 edu_d4*dpt_d2
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_both_prod
) - 查看结果:双击
eq_both_prod
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.18:

图 8.17: 同时含虚拟变量和定量变量的、乘法形式的经典线性回归模型Eviews实现

图 8.18: 同时含虚拟变量和定量变量的、乘法形式的经典线性回归模型Eviews报告
- Eviews操作2(同时含有虚拟变量和定量变量的、乘法形式的半对数回归模型见方程(8.46),菜单操作实现具体见图@ref(fig:both-prod-part-graph):
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
edu_d1
dpt_d1
sex_d1
- 设置回归模型。进入引导设置Equation Estimation \(\Rightarrow\) specification
- Equation specification:输入命令
log(wage) c dpt_d2 sex_d2 age edu_d2*dpt_d2 edu_d3*dpt_d2 edu_d4*dpt_d2
- Estimation settings:
- Method: 下拉选择LS - Least Squares (NLS and ARMA)
- Sample: (默认设置)
- 点击完成:OK
- 命名保存方程对象
:(建议命名为
eq_both_prod_log_part
) - 查看结果:双击
eq_both_prod_log_part
- Equation specification:输入命令
- 确定基础组为[文盲&短期合同&女性],则如下虚拟变量将不进入回归模型
具体Eviews报告见8.20:

图 8.19: 同时含虚拟变量和定量变量的、乘法形式的半对数线性回归模型Eviews实现

图 8.20: 同时含虚拟变量和定量变量的、乘法形式的半对数线性回归模型Eviews报告
8.5.4.2.1 报告解读
同时含虚拟变量和定量变量的、乘法形式的经典回归模型(全部变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} edu_{pri}&& + \beta_{4} edu_{mid}&& + \beta_{5} edu_{hig}\\ &\text{(cont.)}&& + \beta_{6} dpt_{per}&& + \beta_{7} age&& + \beta_{8} edu_{pri} \ast dpt_{per}&& + \beta_{9} edu_{mid} \ast dpt_{per}&& + \beta_{10} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.47} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+19.43&&-70.34sex_{m}&&+32.29edu_{pri}&&+35.59edu_{mid}&&+777.93edu_{hig}\\ &\text{(t)}&&(0.7215)&&(-3.1451)&&(1.0706)&&(1.0830)&&(8.1760)\\ &\text{(se)}&&(26.9248)&&(22.3647)&&(30.1607)&&(32.8591)&&(95.1488)\\ &\text{(cont.)}&&+54.46dpt_{per}&&+3.25age&&-26.81edu_{pri} \ast dpt_{per}&&+59.80edu_{mid} \ast dpt_{per}&&-766.28edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.3131)&&(4.4121)&&(-0.4864)&&(1.1521)&&(-7.2326)\\ &\text{(se)}&&(23.5466)&&(0.7361)&&(55.1151)&&(51.9083)&&(105.9477)\\ &\text{(fitness)}&& n=114;&& R^2=0.5725;&& \bar{R^2}=0.5355\\ & && F^{\ast}=15.48;&& p=0.0000\\ \end{alignedat} \tag{8.48} \end{equation}\]
此时,根据总体回归模型(8.47)和样本回归方程(8.48)我们可以得到:
- 基础组(文盲 & 短期合同 & 女性),也即(illiteracy & temporary & female)的期望工资收入为(年龄age=30):
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)+\beta_{6}(0)\\&+\beta_{7}(30)+\beta_{8}(0)\cdot(0)+\beta_{9}(0)\cdot(0)+\beta_{10}(0)\cdot(0)\\=&+\beta_{1}\\&+30\beta_{7}\\\end{split}\tag{8.49}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 0;sex_{m}= 0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)+\hat{\beta}_{5}(0)\\ &+\hat{\beta}_{6}(0)+\hat{\beta}_{7}(30)+\hat{\beta}_{8}(0)+\hat{\beta}_{9}(0)+\hat{\beta}_{10}(0)\\ =&+[19.43]+[-70.34]\cdot(0)+[32.29]\cdot(0)+[35.59]\cdot(0)+[777.93]\cdot(0)\\ &+[54.46]\cdot(0)+[3.25]\cdot(30)+[-26.81]\cdot(0)+[59.80]\cdot(0)+[-766.28]\cdot(0)\\ =&116.8569\\ \end{split} \tag{8.50} \end{align}\]
- 比较组1(文盲 & 长期合同 & 女性),也即(illiteracy & permanent & female)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 1;sex_{m}= 0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(0)\\&+\beta_{6}(1)+\beta_{7}(30)+\beta_{8}(0)\cdot(1)+\beta_{9}(0)\cdot(1)+\beta_{10}(0)\cdot(1)\\=&+\beta_{1}\\&+\beta_{6}+30\beta_{7}\\\end{split}\tag{8.51}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 0;dpt_{per}= 1;sex_{m}= 0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)+\hat{\beta}_{5}(0)\\ &+\hat{\beta}_{6}(1)+\hat{\beta}_{7}(30)+\hat{\beta}_{8}(0)+\hat{\beta}_{9}(0)+\hat{\beta}_{10}(0)\\ =&+[19.43]+[-70.34]\cdot(0)+[32.29]\cdot(0)+[35.59]\cdot(0)+[777.93]\cdot(0)\\ &+[54.46]\cdot(1)+[3.25]\cdot(30)+[-26.81]\cdot(0)+[59.80]\cdot(0)+[-766.28]\cdot(0)\\ =&171.3216\\ \end{split} \tag{8.52} \end{align}\]
- 比较组2(高等教育 & 长期合同 & 女性),也即(higher & permanent & female)的期望工资收入为:
\[\begin{align} \begin{split}E(wage&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 1;dpt_{per}= 1;sex_{m}= 0)\\=&+\beta_{1}+\beta_{2}(0)+\beta_{3}(0)+\beta_{4}(0)+\beta_{5}(1)+\beta_{6}(1)\\&+\beta_{7}(30)+\beta_{8}(0)\cdot(1)+\beta_{9}(0)\cdot(1)+\beta_{10}(1)\cdot(1)\\=&+\beta_{1}+\beta_{5}+\beta_{6}\\&+30\beta_{7}+\beta_{10}\\\end{split}\tag{8.53}\end{align}\] \[\begin{align} \begin{split} (\widehat{wage}&|age=30;edu_{pri}= 0;edu_{mid}= 0;edu_{hig}= 1;dpt_{per}= 1;sex_{m}= 0)\\ =&+\hat{\beta}_{1}+\hat{\beta}_{2}(0)+\hat{\beta}_{3}(0)+\hat{\beta}_{4}(0)+\hat{\beta}_{5}(1)\\ &+\hat{\beta}_{6}(1)+\hat{\beta}_{7}(30)+\hat{\beta}_{8}(0)+\hat{\beta}_{9}(0)+\hat{\beta}_{10}(1)\\ =&+[19.43]+[-70.34]\cdot(0)+[32.29]\cdot(0)+[35.59]\cdot(0)+[777.93]\cdot(1)\\ &+[54.46]\cdot(1)+[3.25]\cdot(30)+[-26.81]\cdot(0)+[59.80]\cdot(0)+[-766.28]\cdot(1)\\ =&182.9746\\ \end{split} \tag{8.54} \end{align}\]
同时含虚拟变量和定量变量的、乘法形式的经典回归模型(部分变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &wage=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} age&& + \beta_{5} edu_{pri} \ast dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} edu_{mid} \ast dpt_{per}&& + \beta_{7} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.55} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{wage}=&&+23.30&&-76.57sex_{m}&&+29.97dpt_{per}&&+3.88age&&+5.31edu_{pri} \ast dpt_{per}\\ &\text{(t)}&&(0.7492)&&(-2.7170)&&(1.0501)&&(4.2530)&&(0.0904)\\ &\text{(se)}&&(31.0993)&&(28.1834)&&(28.5419)&&(0.9127)&&(58.7653)\\ &\text{(cont.)}&&+92.00edu_{mid} \ast dpt_{per}&&+13.83edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(1.8086)&&(0.2366)\\ &\text{(se)}&&(50.8699)&&(58.4628)\\ &\text{(fitness)}&& n=114;&& R^2=0.2945;&& \bar{R^2}=0.2549\\ & && F^{\ast}=7.44;&& p=0.0000\\ \end{alignedat} \tag{8.56} \end{equation}\]
同时含虚拟变量和定量变量的、乘法形式的半对数回归模型(部分变量进入)Eviews结果简要报告如下:
\[\begin{equation} \begin{alignedat}{999} &log(wage)=&& + \beta_{1} && + \beta_{2} sex_{m}&& + \beta_{3} dpt_{per}&& + \beta_{4} age&& + \beta_{5} edu_{pri} \ast dpt_{per}\\ &\text{(cont.)}&& + \beta_{6} edu_{mid} \ast dpt_{per}&& + \beta_{7} edu_{hig} \ast dpt_{per}&&+u\\ \end{alignedat} \tag{8.57} \end{equation}\] \[\begin{equation} \begin{alignedat}{999} &\widehat{log(wage)}=&&+3.76&&-0.67sex_{m}&&+0.24dpt_{per}&&+0.03age&&+0.18edu_{pri} \ast dpt_{per}\\ &\text{(t)}&&(22.7296)&&(-4.4901)&&(1.5822)&&(5.7920)&&(0.5903)\\ &\text{(se)}&&(0.1655)&&(0.1500)&&(0.1519)&&(0.0049)&&(0.3128)\\ &\text{(cont.)}&&+0.57edu_{mid} \ast dpt_{per}&&+0.36edu_{hig} \ast dpt_{per}\\ &\text{(t)}&&(2.1031)&&(1.1564)\\ &\text{(se)}&&(0.2707)&&(0.3112)\\ &\text{(fitness)}&& n=114;&& R^2=0.4616;&& \bar{R^2}=0.4314\\ & && F^{\ast}=15.29;&& p=0.0000\\ \end{alignedat} \tag{8.58} \end{equation}\]
8.5.5 时间序列季节虚拟变量模型
- 目的:通过学习时间序列季节虚拟变量模型,进一步深入理解虚拟变量回归模型的多种形式及应用
- 思路:设置并引入季节虚拟变量,构建时间序列季节虚拟变量模型,Eviews估计回归结果
- 定义:
- 季节模式(seasonal pattern):大多数时间序列经济变量,通常表现出来的季节性往复行为或现象。
- 季节调整(seasonal adjusted):将时间序列经济变量的季节性变化成分去除,从而得到一个新的变量序列的处理过程。
- 理论提示:
\[\begin{align} Y_t=\beta_1+\beta_2X_t+\lambda_2D2_t+\lambda_3D3_t+\lambda_4D4_t+u_t \tag{8.59}\\ Y_t=\beta_2X_t+\lambda_1D1_t+\lambda_2D2_t+\lambda_3D3_t+\lambda_4D4_t+u_t \tag{8.60} \end{align}\]
- Eviews操作(略)
8.5.6 分段线性回归模型(piecewise linear regression)
- 目的:通过学习分段式线性回归模型,进一步深入理解虚拟变量回归模型的多种形式及应用
- 思路:设置并引入虚拟变量,构建分段线性回归模型,Eviews估计回归结果
- 定义:
- 分段现象:在经济关系中,当解释变量\(X\)的值达到某一水平/阀值\(X^\ast\)之前,与被解释变量之间存在某种线性关系;当解释变量X的值达到或者超过水平/阀值\(X^\ast\)以后,与被解释变量的关系就会发生变化。因而总体看来,似乎被明显“分段”了。
- 分段线性回归模型(piecewise linear regression):是指用虚拟变量估计不同水平/阀值的解释变量\(X\)对被解释变量\(Y\)的影响的一类线性回归模型。
- 理论提示:
\[\begin{align} Y_i & =\beta_1+\beta_2X_i+\lambda(X_i-X^{\ast})D_i+u_i \tag{8.61}\\ Y_i & =\beta_1+\beta_2X_i+\lambda_1(X_i-X^{\ast}_1)D1_i+\lambda_2(X_i-X^{\ast}_2)D2_i+u_i \tag{8.62} \end{align}\]
- Eviews操作(略)
8.6 作业题
印度工人工资:表8.8给出给出了114位印度工人在wage工人工资,age年龄,edu教育水平,dpt合同类型,sex性别等方面的数据。
obs | wage | age | edu | dpt | sex |
---|---|---|---|---|---|
1 | 117.00 | 26 | primary | permanent | female |
2 | 375.00 | 42 | primary | permanent | female |
3 | 175.00 | 33 | primary | permanent | female |
4 | 100.00 | 33 | primary | permanent | female |
5 | 162.50 | 30 | primary | permanent | female |
110 | 25.00 | 18 | illiteracy | temporary | male |
111 | 25.00 | 11 | illiteracy | temporary | male |
112 | 75.00 | 45 | illiteracy | temporary | male |
113 | 53.84 | 14 | illiteracy | temporary | male |
114 | 50.00 | 26 | illiteracy | temporary | male |
变量说明见表8.9:
variable | label | remark |
---|---|---|
obs | 工人编号 | 序号 |
wage | 工人工资 | 美元/周 |
age | 年龄 | 岁 |
edu | 教育水平 | illiteracy=文盲;primary=初等教育;secondary=中等教育;higher=高等教育 |
dpt | 合同类型 | temporary=短期合同;permanent=长期合同 |
sex | 性别 | female=女;male=男 |
请回答如下问题:
请对数据表8.8进行数据处理,将定性变量都处理成完全虚拟变量体系(也即定性变量有m个属性,则设置m个虚拟变量)。(要求:定性变量edu的虚拟变量设置为edu_D1,edu_D2,\(\cdots\);定性变量dpt的虚拟变量设置为dpt_D1,\(\cdots\);定性变量sex的虚拟变量设置为sex_D1,\(\cdots\)。虚拟变量的下标请与变量说明表8.9的保持一致)
使用全部变量,并提出一个加法形式的有截距虚拟变量回归模型,用以预测工人工资。要求基础组设置为(文盲&短期合同&女性)的工人组。
- 请写出加法形式的有截距虚拟变量回归模型(PRM)
- 请利用你自己构建的模型,进行eviews分析,得到分析报告。(要求将报告截图过来,并写出相应的简要报告形式——三行式或四行式)
- 根据回归分析结果,请预测如下几类工人的工资水平:(要求分别写出理论表达式,以及数据分析的预测值)
- (文盲&短期合同&女性&50岁)的工人
- (高等教育&长期合同&男性&50岁)的工人
- (初等教育&短期合同&男性&30岁)的工人
- (初等教育&长期合同&女性&30岁)的工人
使用全部变量,并提出一个乘法形式的有截距虚拟变量回归模型,用以预测工人工资。要求基础组设置为(文盲&短期合同&女性)的工人组,且要求教育程度edu的虚拟变量(edu_D1,edu_D2,\(\cdots\))与合同类型dpt的虚拟变量(dpt_D1,\(\cdots\))进行乘法交互。
- 请写出该乘法形式的有截距虚拟变量回归模型(PRM)
- 请利用你自己构建的模型,进行eviews分析,得到分析报告。(要求将报告截图过来,并写出相应的简要报告形式——三行式或四行式)
- 根据回归分析结果,请预测如下几类工人的工资水平:(要求分别写出理论表达式,以及数据分析的预测值)
- (文盲&短期合同&女性&50岁)的工人
- (高等教育&长期合同&男性&50岁)的工人
- (初等教育&短期合同&男性&30岁)的工人
- (初等教育&长期合同&女性&30岁)的工人
使用全部变量,对因变量ln(wage)提出一个乘法形式的有截距虚拟变量回归模型,用以预测工人工资。要求基础组设置为(文盲&短期合同&女性)的工人组,且要求性别sex的虚拟变量(sex_D1,\(\cdots\))与合同类型dpt的虚拟变量(dpt_D1,\(\cdots\))进行乘法交互。
- 请写出该乘法形式的有截距虚拟变量回归模型(PRM)
- 请利用你自己构建的模型,进行eviews分析,得到分析报告,并回答如下问题。(要求将报告截图过来,并写出相应的简要报告形式——三行式或四行式)
- 你认为这些新引入的交互项看上去有显著的交互影响吗?
- 男性工人与女性工人相比,收入存在明显差异吗?请给出你的理由。
- 长期合同的男性工人与长期合同的女性工人,收入存在明显差异吗?请给出你的理由。
- 短期合同的男性工人与长期合同的女性工人,收入存在明显差异吗?请给出你的理由。
- 根据回归分析结果,请预测如下几类工人的工资水平:(要求分别写出理论表达式,以及数据分析的预测值)
- (文盲&短期合同&女性&50岁)的工人
- (高等教育&长期合同&男性&50岁)的工人
- (初等教育&短期合同&男性&30岁)的工人
- (初等教育&长期合同&女性&30岁)的工人
使用除教育edu变量之外的其他全部变量,对因变量ln(wage)提出一个乘法形式的有截距虚拟变量回归模型,用以预测工人工资。要求基础组设置为(文盲&短期合同&女性)的工人组,且要求教育程度edu的虚拟变量(edu_D1,edu_D2,\(\cdots\))与合同类型dpt的虚拟变量(dpt_D1,\(\cdots\))进行乘法交互。
- 请写出该乘法形式的有截距虚拟变量回归模型(PRM)
- 请利用你自己构建的模型,进行eviews分析,得到分析报告,并回答如下问题。(要求将报告截图过来,并写出相应的简要报告形式——三行式或四行式)
- 你认为这些新引入的交互项看上去有显著的交互影响吗?
- 高等数育的工人与初等教育的工人,收入存在明显差异吗?请给出你的理由。
- [高等教育的长期合同工人]与[高等教育的短期合同工人],收入存在明显差异吗?请给出你的理由。
- [高等教育的短期合同工人]与[初等教育的长期合同工人],收入存在明显差异吗?请给出你的理由。
- 根据回归分析结果,请预测如下几类工人的工资水平:(要求分别写出理论表达式,以及数据分析的预测值)
- (文盲&短期合同&女性&50岁)的工人
- (高等教育&长期合同&男性&50岁)的工人
- (初等教育&短期合同&男性&30岁)的工人
- (初等教育&长期合同&女性&30岁)的工人
一个定性变量如果有m个属性,那么可以用m个虚拟变量完全表达该定性变量,也可以用\((m-1)\)个虚拟变量充分表达该定性变量。↩︎
方差分析模型(Analysis of variance, ANOVA)常用来分析定量化的因变量\(Y\)与定性回归元或虚拟变量之间的统计显著性关系。一般是通过比较不同类别或不同组的均值差,例如采用t检验可以判断两组均值是否有显著的差异↩︎
有时候模型设置中,某个虚拟变量体系(用来表达某个定性变量)的独立项可以完全不出现在方程中(也即没有它们的加法形式),而却可以出现它们与其他变量的交叉项(也即可以出现它们与其他变量的乘法形式)。↩︎
如果理论要求与基础组对比,则理论模型必须设置为有截距回归模型;否则,理论模型需要设置无截距回归模型。↩︎
半对数或对数模型将蕴含着弹性和斜率的经济学含义,在解释虚拟变量回归模型中往往很有现实意义。↩︎
具体细节请参看Eviews在线学习文档,网址http://www.eviews.com/Learning/dummies.html↩︎
此时我们可以完全不用关心模型是否有截距(意味着是否有对照比较的基础组)↩︎
理论上,基础组如何选择并不会从根本上改变模型的实际经济学意义,只是一旦选定一个基础组,也就意味着确定了一个相互比较的“基础参照系”。↩︎