您的当前位置：首页最新《计量经济学》第四章题及答案资料

最新《计量经济学》第四章题及答案资料

来源：爱玩科技网

精品文档

第四章：多重共线性

二、简答题

1、导致多重共线性的原因有哪些？

2、多重共线性为什么会使得模型的预测功能失效？ 3、如何利用辅回归模型来检验多重共线性？

4、判断以下说法正确、错误，还是不确定？并简要陈述你的理由。

(1)尽管存在完全的多重共线性，OLS估计量还是最优线性无偏估计量（BLUE）。

(2)在高度多重共线性的情况下，要评价一个或者多个偏回归系数的个别显著性是不可能的。 (3)如果某一辅回归显示出较高的Ri值，则必然会存在高度的多重共线性。 (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。

(5)如果回归的目的仅仅是为了预测，则变量之间存在多重共线性是无害的。 5、考虑下面的一组数据： Y -10 1 1 -8 2 3 -6 3 5 -4 4 7 -2 5 9 0 6 11 2 7 13 4 8 15 6 9 17 8 10 19 10 11 21 2X2 X3 如果我们用模型： Yi12X2i3X3i

来对以上数据进行拟合回归。

(1) 我们能得到这3个估计量吗？并说明理由。

(2) 如果不能，那么我们能否估计得到这些参数的线性组合？可以的话，写出必要的计

算过程。

6、考虑以下模型：

23 Yi12Xi3Xi4Xii

由于X和X是X的函数，那么它们之间存在多重共线性。这种说法对吗？为什么？ 7、在涉及时间序列数据的回归分析中，如果回归模型不仅含有解释变量的当前值，同时还含有它们的滞后值，我们把这类模型称为分布滞后模型（distributed-lag model）。我们考虑以下模型：

23Yi12Xt3Xt13Xt23Xt3t

其中Y——消费，X——收入，t——时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。

（1）在这一类模型中是否会存在多重共线性？为什么？（2）如果存在多重共线性的话，应该如何解决这个问题？ 8、设想在模型

Yi12X2i3X3ii

中，X2和X3之间的相关系数r23为零。如果我们做如下的回归：精品文档

精品文档

Yi12X2i1i Yi13X3i2i

ˆ且ˆ？为什么？ ˆ2ˆ3（1）会不会存在23ˆ会等于ˆ1或ˆ1或两者的某个线性组合吗？（2）1ˆ)var(ˆ)？ ˆ2)且var(ˆ3)var(（3）会不会有var(239、通过一些简单的计量软件（比如EViews、SPSS），我们可以得到各变量之间的相关矩阵：

1r32 Rrk2三、计算题

1、考虑消费函数

r231rk3r2kr3k。 1怎样可以从相关矩阵看出完全多重共线性、近似多重共线性或者不存在多重共线性？

Ci12Yt3Wtt t1,2,n, 其中，C、Y、W依次表示消费、收入与财富。下面是假想数据。 C 70 65 90 95 110 115 120 140 155 150 Y 80 100 120 140 160 180 200 220 240 260 W 810 1009 1273 1425 1633 1876 2252 2201 2435 2686 (1) 作C对Y和W的普通最小二乘回归。

(2) 这一回归方程是否存在着多重共线性？你的判断依据是什么？ (3) 分别作C对Y和W的回归，这些回归结果表明了什么？ (4) 作W对Y的回归。这一回归结果表明了什么？

(5) 如果存在严重的共线性，你是否会删除一个解释变量？为什么？ 2、下表给出了美国1971-1986年期间新客车出售的数据。年份 1971 1972 1973 精品文档

Y 10227 10872 11350 X2 112.0 111.0 111.1 X3 121.3 125.3 133.1 X4 776.8 839.6 X5 4. 4.55 X6 79367 82153 精品文档

949.8 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 8775 8539 9994 11046 111 10559 79 8535 7980 9179 10394 11039 11450 117.5 127.6 135.7 142.9 153.8 166.0 179.3 190.2 197.6 202.6 208.5 215.2 224.4 147.7 161.2 170.5 181.5 195.3 217.7 247.0 272.3 286.6 297.4 307.6 318.5 323.4 1038.4 1142.8 1252.6 1379.3 1551.2 1729.3 1918.0 2127.6 2261.4 2428.1 2670.6 2841.1 3022.1 7.38 8.61 6.16 5.22 5.50 7.78 10.25 11.28 13.73 11.20 8.69 9.65 7.75 6.31 850 86794 85846 88752 92017 96048 98824 99303 100397 99526 100834 105005 107150 109597 Y——新车出售量，未经季节调整数量；

X2——新车，消费者价格指数，1967年=100，未经季节调整； X3——消费者价格指数，1967年=100，未经季节调整； X4——个人可支配收入，10亿美元，未经季节调整； X5——利率，百分数，金融公司票据直接使用； X6——民间就业劳动人数（个人），未经季节调整。

（1）如果你决定使用表中全部回归元作为解释变量，可能会遇到多重共线性吗？为什

么？

（2）如果你这样认为的话，你准备怎样解决这个问题？明确你的假设并说明全部计算。（3）制定适当的线性或者对数线性的模型，以估计美国对汽车的需求函数。

第二部分：参

一、术语解释

1、多重共线性：对于经典线性回归模型（CLRM）

Yi01X1i2X2ikXkiui i1,2,n

如果上式中某两个或多个解释变量之间出现了相关性，则称为存在多重共线性。依据解释变量之间共线性的程度不同，可以分为完全多重共线性和近似多重共线性。

2、完全多重共线性与近似多重共线性：所谓完全多重共线性，是指线性回归模型中的若干解释变量或全部解释变量之间具有严格的线性关系，也就是说，对于多元线性回归模型，若各解释变量X1,X2,,Xk的之间存在如下的关系式：精品文档

精品文档

1X12X2kXk0

式中1,2,,k是不全为零的常数，则称这些解释变量之间存在完全多重共线性。当各解释变量X1,X2,,Xk的之间存在如下的近似的线性关系：

1X12X2kXk0

则可以说上述解释变量之间存在近似多重共线性。还可以采用如下的方式，在近似线性关系式中，假设i0，则可将此近似线性关系表示为：

Xi1X1i1Xi1i1Xi1kXkvi

其中ll/i,vi为随机误差项。

3、辅回归：在变量之间存在多重共线性的情况下，有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系，我们可以将每个Xi对其余变量进行回归，即

Xi1X1i1Xi1i1Xi1kXkvi

这种回归叫做辅回归，它是相对于Y对各个X的主回归而言的。

二、简答题

1、答：

经济数据中大量存在多重共线性这一现象，主要原因在于：经济领域很难象其它实验学科那样从控制性试验中获得数据；此外，可能有经济变量结构上的原因，也有数据收集与模型设定方面的原因，具体的，有以下几种：

（1）所使用的数据收集方法。我们只能在一个有限的范围内得到观察值，无法进行重复试验。

（2）模型或从中取样的总体受到约束（经济变量的共同趋势）。（3）模型设定的偏误。

（4）过度决定的模型。这种情况尤其容易发生在解释变量的个数大于观测值个数的情形。

由于上述原因，实际应用中，解释变量之间总会存在一定程度的线性相关，因此，问题不是多重线性有无，而是多重共线性的严重程度。

2、答：

多元线性回归模型的一个重要应用是经济预测。对于模型

YX

如果给定样本以外的解释变量的观测值X0，就可以得到被解释变量的预测值

Y0X0

但是，这只是被解释变量的预测值的估计值而不是预测值。预测值仅以某一个置信水平位于精品文档

精品文档

以该估计值为中心的一个区间中。对于预测的置信区间，我们利用的是构造t统计量，得到

－的置信水平下Y0的置信区间为在给定1Y0t/21X0X'XX0'Y0Y0t/21X0X'XX0'

11显然，当解释变量之间存在多重共线性时， X'X非常大，故而Y0的置信区间也很

－1大，因此，模型的预测功能失效。 3、答：

辅回归是相对于Y对各个X的主回归而言的。在变量之间存在多重共线性的情况下，有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系，我们可以将每个Xi对其余变量进行回归，即

Xi1X1i1Xi1i1Xi1kXkvi，

并计算相应的决定系数，分别记为Ri。然后，我们在建立统计量：

2Ri2(k2) Fi(1Ri2)(nk1)它服从自由度为k-2和n-k+1的F分布。其中n为样本大小，k为包括常数项在内的解释变量个数。如果计算出的Fi超过了相应自由度的临界值，则认为这个Xi和其余的解释变量存在共线性；如果Fi未超过临界值，则认为这个Xi和其余的解释变量不存在共线性。这种辅回归模型检验不仅可以检验是否存在多重共线性，而且还可以得到多重共线性的具体形式。

4、答：

（1）错。如果变量之间存在完全的线性关系时，我们甚至无法估计其系数或者标准误。（2）错。在高度多重共线性的情况下，仍然可以得到一个或者多个显著的t值。（3）错。OLS估计量的方差有下式给出：

ˆ)var(i22ix1 21Riˆ或者很高的从此式可以看出，一个很高的Ri可被一个很低的22x2i抵消掉。

（4）错。如果一个模型只有两个回归元，两两之间的高度相关系数便表示存在多重共线性。但是在变量之间存在多重共线性的前提下，可能是几个变量之间的关系。变量之间的相关系数较高是存在多重共线性的充分非必要条件。

（5）不确定。如果观测到共线性在后来的样本数据中继续存在，或许无害。但如果不是这样，或者目的在于做出精确的估计的话，多重共线性便成为问题。如果仅仅要是预测的话，预测有效的前提条件是模型结构的稳定。

5、答：精品文档

精品文档

（1）不能。通过对X2和X3的观察，我们可以知道它们存在以下的关系：

X3i2X2i1，所以可知变量X2和X3是完全线性相关的。

（2）把方程写成

Yi12X2i3(2X2i1)i (13)(223)X2ii

12X2ii其中113,2223。

因此，我们可以唯一的估计出1和2，但无法估计出原始的，因为两个方程无法解出三个未知数。

6、答：

这种说法不正确。因为x和x都是x的非线性函数，把它们包括在回归模型中并不违反经典性线性回归模型的基本假设。多重共线性的相关是指的变量之间的线性相关。

7、答：

（1）是的。经济时间序列数据有同向变动的趋势。在这里，收入的滞后变量一般也可以相同的方向变动。

（2）在遇到时间序列数据存在线性相关性时，我们一般都是采用一阶或者高阶差分变换来消除共线性。

8、答：

（1）是的。这是因为X2和X3之间的相关系数为0，所以系数的表达式

23ˆ2(yix2i)(x3i2)(yix3i)(x2ix3i)、

(x2i2)(x3i2)(x2ix3i)2(yix3i)(x2i2)(yix2i)(x2ix3i)

ˆ3(x2i)(x3i)(x2ix3i)222中的交叉乘积项消失，从而变成与和系数同样的表示式。（2）是它们的一个线性组合。证明如下：

ˆYˆXˆX12233ˆX ˆ1Yˆ2X2Y 22ˆXˆ2Yˆ3X3Y33ˆˆ1ˆ1Y。因此有1精品文档

精品文档

（3）不是。原因如下：

ˆ) var(2ˆ222x(1r2i23)ˆ22x2i,(r2320)

ˆ var(2)ˆ2。

22ix9、答：

我们可以利用相关矩阵的行列式来判断多重共线性与否，可以利用R的行列式大小来判断多重共线性的强弱。

（1）若R的行列式为0时，则存在完全的共线性。

（2）若R的行列式很小接近于0时，则存在近似的共线性。（3）若R的行列式为1时，则变量正交、不存在共线性。

三、计算题

1、解：

（1）使用EViews软件进行回归 Dependent Variable: SER01 Method: Least Squares

Date: 07/02/06 Time: 19:32 Sample: 1 10

Included observations: 10 Variable C W Y R-squared

Coefficient 24.33698 -0.034952 0.8710 Std. Error t-Statistic Prob. 0.0061 0.2839 0.0276 111.0000 31.423 6.780239 6.871015 106.5019 0.000006 6.280051 3.875284 0.030120 -1.160433 0.314379 2.772576 0.968182 Mean dependent

var

Adjusted R-squared 0.959092 S.D. dependent var S.E. of regression 6.356758 Akaike info criterion Sum squared resid 282.8586 Schwarz criterion Log likelihood -30.90120 F-statistic Durbin-Watson stat 2.941201 Prob(F-statistic) 回归得到的方程为：

ˆ24.340.03Wˆ0.87Yˆ。 Yi（2）有。R-squared的值为0.968182，但是系数W通过不过显著性检验。

（3）

Variable Coefficient Std. Error t-Statistic Prob.

Y R-squared 精品文档

24.45455 0.509091 6.413817 0.035743 3.812791 14.24317 0.0051 0.0000 111.0000 0.962062 Mean dependent 精品文档

var

Adjusted R-squared 0.957319 S.D. dependent var S.E. of regression 6.493003 Akaike info criterion Sum squared resid 337.2727 Schwarz criterion Log likelihood -31.78092 F-statistic Durbin-Watson stat 2.680127 Prob(F-statistic)

Variable C

W R-squared

Coefficient 26.45198 0.048039 Std. Error 8.446165 0.004543 t-Statistic 3.131833 10.57519 Prob. 0.0140 0.0000 111.0000 31.423 7.321304 7.381821 111.8346 0.000006 31.423 6.756184 6.816701 202.8679 0.000001 0.933241 Mean dependent

var

Adjusted R-squared 0.9246 S.D. dependent var S.E. of regression 8.613107 Akaike info criterion Sum squared resid 593.4849 Schwarz criterion Log likelihood -34.60652 F-statistic Durbin-Watson stat 2.3869 Prob(F-statistic) 在这两个回归中，系数是显著的，而在同时对两个变量进行回归时，却存在部分系数的不显著，说明变量之间存在多重共线性。

（4）

Variable Coefficient Std. Error t-Statistic Prob.

Y R-squared

-3.363636 10.37273 73.70690 -0.045635 0.410753 25.25299 0.97 0.0000 1760.000 632.0272 11.63947 11.69998 637.7133 0.000000 Prob. 0.0000 1760.000 632.0272 11.43973 11.46999 2.366224 0.987611 Mean dependent

var

Adjusted R-squared 0.986062 S.D. dependent var S.E. of regression 74.61690 Akaike info criterion Sum squared resid 44541.45 Schwarz criterion Log likelihood -56.19734 F-statistic Durbin-Watson stat 2.366673 Prob(F-statistic)

Variable Y R-squared

Coefficient 10.35497 Std. Error 0.123991 t-Statistic 83.51400 0.987607 Mean dependent

var

Adjusted R-squared 0.987607 S.D. dependent var S.E. of regression 70.358 Akaike info criterion Sum squared resid 44553.05 Schwarz criterion Log likelihood -56.198 Durbin-Watson stat 不管是否带上常数项，R-squared的值都非常大（>0.98），而且Y的系数都通过显著性检验，说明W和Y存在高度的共线性。

（5）在满足模型的经济含义的前提下（以免造成模型设置失误），我们还是可以通过舍去W或者Y来消除共线性的精品文档

精品文档

2、解：

（1）首先我们发现各个变量在数量级上存在较大差别，所以我们一般考虑对数线性回归模型。如果我们的对数回归模型中包含了所有的解释变量，则得到如下的结果： Dependent Variable: LOG(Y) Method: Least Squares

Date: 07/02/06 Time: 20:31 Sample: 1971 1986

Included observations: 16 Variable C LOG(X2) LOG(X3) LOG(X4) LOG(X5) LOG(X6) R-squared

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

Durbin-Watson stat Coefficient 3.254859 1.790153 -4.108518 2.127199 -0.030448 0.277792 Std. Error t-Statistic Prob. 0.8682 0.0675 0.0280 0.1217 0.8077 0.42 19.11656 0.1702 0.873240 2.050012 1.599678 -2.568341 1.257839 1.691154 0.121848 -0.249884 2.036975 0.136375 0.854803 Mean dependent 9.204273

var

0.782205 S.D. dependent var 0.119580 0.055806 Akaike info criterion -2.65387

0.031143 Schwarz criterion -2.315

27.23099 F-statistic 11.77442 1.793020 Prob(F-statistic) 0.000624 我们发现R-squared=0.854803>0.80，LOG(X4) 、LOG(X5) 、LOG(X6)都不能通过

0.10的显著性检验。我们可以得出结论，各变量之间存在多重共线性。

（2）由于有5个解释变量，我们可以考虑消除部分解释变量重新对参数进行估计，以得到正确的回归方程。

我们首先得到个解释变量之间的相关系数矩阵： X2 X3 X4 X5 X6

X2 1 0.99685840.9913536740.5258296790.972144554

32 836 627 185

X3 0.99685841 0.9912736320.54331290.965239229

32 9 977 554

X4 0.9913536740.9912736321 0.4614362780.972615371

836 9 037 514

X5 0.5258296790.54331290.4614362781 0.536184793

627 977 037 714

X6 0.9721445540.9652392290.9726153710.5361847931

185 554 514 714

我们发现只有X5与其它变量的相关系数较低，其余几个变量之间的相关系数都较高（>0.95），所以我们认为X5是可以留在模型中的，对于其他几个变量的选择问题就要考虑模型的实际经济含义以及各变量之间的经济关系。

从不同的角度出发，可能会去掉不同的变量。以下是考虑问题的一个角度：新车CPI精品文档

精品文档

和一般的CPI高度相关（0.997），PDI和新车CPI之间也高度相关（0.991）；PDI与就业水平也密切相关，两者的相关系数高达0.972。我们可以考虑去掉一般CPI和PDI。

（3）我们利用保留的X2、X5、X6来估计模型： Dependent Variable: LOG(Y) Method: Least Squares

Date: 07/02/06 Time: 20:52 Sample: 1971 1986

Included observations: 16 Variable C LOG(X2) LOG(X5) LOG(X6) R-squared

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

Durbin-Watson stat

Coefficient -22.10374 -1.037839 -0.294929 3.243886 Std. Error t-Statistic Prob. 0.0216 0.0085 0.0018 0.0029 8.373593 -2.639696 0.330227 -3.142805 0.073704 -4.001514 0.872231 3.719068 0.684855 Mean dependent 9.204273

var

0.606069 S.D. dependent var 0.119580 0.075053 Akaike info criterion -2.123

0.067595 Schwarz criterion -1.93578

21.03144 F-statistic 8.692569 1.309678 Prob(F-statistic) 0.002454 精品文档

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文