当我们构造线性模型时,我们注意变量间的相关性。在相关矩阵中搜索相关系数时,如果我们发现3对变量的相关系数是(Var1和Var2,Var2和Var3,Var3和Var1)是-0.98,0.45,1.23.我们可以得出什么结论:()。
A.Var1和Var2是非常相关的
B.因为Va1r和Var2是非常相关的,我们可以去除其中一个
C.Var3和Var1的1.23相关系数是不可能的
A.Var1和Var2是非常相关的
B.因为Va1r和Var2是非常相关的,我们可以去除其中一个
C.Var3和Var1的1.23相关系数是不可能的
A.Var1和Var2具有很高的相关性
B.Var1和Var2存在多重共线性,模型可以去掉其中一个特征
C.Var3和Var1相关系数为1.23是不可能的
D.以上答案都不正确
令d表示一个(二值)虚拟变量,并令:表示一个定量变量。考虑模型
这是含有一个虚拟变量和一个定量变量之交互作用的一般性模型[方程(7.17)中有一个例子]。
(i)由于没有重大变化,所以取误差为u=0。于是,当d=0时,我们可以把y和z之间的关系写成函数f0(z)=β0+β1z.当d=1时,同样写出y和z之间的关系,其中左边应该使用f(z),以表示Z的线性函数。
其中所有系数和标准误都保留到小数点后三位。利用这个方程,求出使得男女log(wage)的预测值相等的totcoll值。
(iv)基于第(iii)部分中的方程,女人能现实地获得足够多的大学教育而赶上男人的工资吗?请解释。
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
A.简化式方程的解释变量都是前定变量
B.简化式参数反映解释变量对被解释的变量的总影响
C.简化式参数是构造式参数的线性函数
D.简化式模型的经济含义不明确
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
利用AIRFARE.RAW中的数据。我们的兴趣在于估计模型
其中,θt意味着,我们容许每年的截距有所不同。
(i)用混合OLS估计上述方程,注意包含年度虚拟变量。若Δconcen=0.10,估计fare提高了多少个百分点?
(ii)的通常OLS的95%置信区间是什么?它为什么可能不太可靠?如果你有能计算充分稳健标准误的统计软件,求出β1的充分稳健的95%置信区间。与通常的置信区间相比较,并评论。
(iii)描述log(dist)的二次项出现的情况。特别是,dist取何值时,log(fare)和dit之间开始出现正向关系。[提示:首先计算log(dist)的转折点,然后取指数。]转折点出现在数据范围之外吗?
(iv)现在用随机效应法估计方程。β1的估计值有何变化?
(v)现在用固定效应法估计方程。β1的FE估计值是多少?它为何与RE估计值相当类似?(提示:RE估计的入是多少?)
(vi)指出由ai刻画的两个航线特征(除起降距离之外)。这些特征可能与concenit相关吗?
(vii)你相信航线更集中会提高飞机票价吗?最佳估计值是什么?
A.各个解释变量对被解释变量的影响将难以准确鉴别
B.局部解释变量与随机误差项之间将高度相关
C.估计量的精度将大幅度下降
D.估计对于样本容量的变动将十分敏感
E.模型的随机误差项也将序列相关
为了检验抵押贷款市场中的歧视,可使用一个线性概率模型:
(i)如果对少数民族存在歧视,并控制了适当的因素,那么,的符号是什么?
(ii)将qpxe对white做回归,并以通常的形式报告结果。解释white的系数。它是统计显著的吗?它实际上大吗?
(iii)作为控制因素,增加变量hrat,obrat,loanprc,unem,male,married,dep,sch,cosign,chist,pubrec,mortlatl,mortlat2和vr。white的系数会有什么变化?仍有对非白人存在歧视的证据吗?
(iv)现在容许种族效应与度量了其他债务占收入比例的变量(obrat)存在着交互作用。交互项显著吗?
(v)利用第(iv)部分的模型,当债务负担达到样本均值obrat=32时,作为白人对贷款许可的概率有多大的影响?构造这种影响的一个95%的置信区间。
A.如果模型的R2很高,我们可以认为此模型的质量较好
B.如果模型的R2较低,我们可以认为此模型的质量较差
C.如果某一参数不能通过显著性检验,我们应该剔除该解释变量
D.如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量
A.如果模型的R2很高,我们可以认为此模型的质量较好
B.如果模型的R2较低,我们可以认为此模型的质量较差
C.如果某一参数不能通过显著性检验,我们应该剔除该解释变量
D.如果某一参数不能通过显著性检验,我们也不应该随便剔除该解释变量