(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?(ii)从式(11.2
(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?
(ii)从式(11.27)中去掉时间趋势并添加变量ww2和pil(不要对虚拟变量进行差分)。这两个变量在5%的水平上是显著的吗?
(iii)用第(ii)部分中的模型估计LRP并求出其标准误。与从式(10.19)得到的结果相比较,在式(10.19)中gfr和pe是以水平值形式而非差分形式出现的。
(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?
(ii)从式(11.27)中去掉时间趋势并添加变量ww2和pil(不要对虚拟变量进行差分)。这两个变量在5%的水平上是显著的吗?
(iii)用第(ii)部分中的模型估计LRP并求出其标准误。与从式(10.19)得到的结果相比较,在式(10.19)中gfr和pe是以水平值形式而非差分形式出现的。
本题利用NBASAL.RAW中的数据。
(i)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常的形式报告结果。
(ii)在第(i)部分中,你为什么不将所有三个位置虚拟变量包括进来?
(iii)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗?
(iv)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效(就单场得分来说)?
(v)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分?
(vi)使用单场助攻次数作为因变量估计(iv)中的模型。与(iv)的结果有明显的差异吗?请讨论。
在线性消费函数cons=β0+β1inc中,收入的(估计)边际消费倾向(MPC)无非就是斜率β1而平均消费倾向(APC)为cons/inc=β0/inc+β1.利用对100个家庭的年收入和消费观测(均以美元计),便得到如下方程:
cons=-124.84+0.853inc
n=100,R2=0.692
(i)解释这个方程中的截距,并评价它的符号和大小。
(ii)当家庭收入为30000美元时,预计消费为多少?
(iii)以inc为X轴,画出估计的MPC和APC图。
令d表示一个(二值)虚拟变量,并令:表示一个定量变量。考虑模型
这是含有一个虚拟变量和一个定量变量之交互作用的一般性模型[方程(7.17)中有一个例子]。
(i)由于没有重大变化,所以取误差为u=0。于是,当d=0时,我们可以把y和z之间的关系写成函数f0(z)=β0+β1z.当d=1时,同样写出y和z之间的关系,其中左边应该使用f(z),以表示Z的线性函数。
其中所有系数和标准误都保留到小数点后三位。利用这个方程,求出使得男女log(wage)的预测值相等的totcoll值。
(iv)基于第(iii)部分中的方程,女人能现实地获得足够多的大学教育而赶上男人的工资吗?请解释。
设向量组线性无关,如在向量组的前面加入一个向量β, 证明:在向量组中至多有一个向量ai(1≤i≤r)可由其前面的i个向量线性表示.并在R3中做几何解释.
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
利用NYSE.RAW中的数据。
(i)估计教材方程(12.47)中的模型并求OLS残差平方。求u2t在整个样本中的平均值、最小值和最大值。
(ii)利用OLS残差平方估计如下的异方差性模型
报告估计系数、标准误、R²和调整R²。
(ii)将条件方差描述成滞后return-1的函数。方差在return_,取何值时最小?这个方差是多少?
(iii)为了预测动态方差,第(ii)部分的模型得到了负的方差估计值吗?
(v)第(ii)部分中的模型拟合效果比教材例12.9中的ARCH(1)模型更好还是更差?请解释。
(vi)在教材方程(12.51)的ARCH(1)回归中添加二阶滞后ut-22。这个滞后看起来重要吗?这个ARCH(2)模型比第(ii)部分中的模型拟合得更好吗?
在例7.2中,令noPC表示一个虚拟变量:没有一台个人计算机的学生取值1,否则取值0。
(i)如果用noPC取代方程(7.6)中的PC,所估计方程的截距会怎么样?noPC的系数是多少?
(ii)如果用noPC取代PC,R2会有什么变化?
(iii)PC和noPC应该都作为自变量包括进模型中吗?请解释。
用到SMOKE.RAW中的数据。
(i)估计抽烟影响年收入(可能通过因病损失的工作日或生产力效应)的一个模型是
其中,cigs表示平均每天抽烟的数量。你如何解释民?
(ii)为了反映香烟消费可能与收入同时决定,一个香烟需求方程是
其中,cigpric表示每包香烟的价格(美分),而restaurn表示一个二值变量,并在这个人所定居的州有餐馆抽烟限制时等于1。假定这些变量对个人而言都是外生的,那么你预期y5和y6具有什么样的符号?
(iii)在什么样的条件下第(i)部分的收入方程可识别?
(iv)用OLS估计收入方程并讨论p,的估计值。
(v)估计cigs的约简型。(记住这就要求将cigs对所有外生变量回归。)log(cigprc)和restaurn在约简型中显著吗?
(vi)现在用2SLS估计收入方程。讨论的估计值与OLS估计值的比较。
(vii)你认为香烟价格和餐馆抽烟限制在收入方程中是外生的吗?
考虑一个雇员水平的模型
其中无法观测变量f是在一个给定的企业i内,对每个雇员的“企业效应”。误差项vi,e是企业i中雇员e所独具的。诸如方程(8.28)中的综合误差就是ui,e=fi+ui,e.
(iv)讨论第(ii)部分对于利用企业层次的平均数据进行WLS估计的意义,其中第i次观测所用的权数就是通常的企业规模。
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。