在回归分析中,下列有关解释变量和被解释变量的说法正确的有()
A.被解释变量和解释变量均为非随机变量
B.被解释变量和解释变量均为随机变量
C.被解释变量为随机变量,解释变量为非随机变量
D.被解释变量为非随机变量,解释变量为随机变量
A.被解释变量和解释变量均为非随机变量
B.被解释变量和解释变量均为随机变量
C.被解释变量为随机变量,解释变量为非随机变量
D.被解释变量为非随机变量,解释变量为随机变量
A、被解释变量的观测值Y与其平均值的离差平方和
B、被解释变量的回归值与其平均值的离差平方和
C、被解释变量的总体离差平方和与残差平方和之差
D、解释变量变动所引起的被解释变量变动的离差的大小
E、随机因素影响所引起的被解释变量的离差大小
bwght=119.77-0.514cigs
(i)当cigs=0时,预计婴儿的出生体重为多少?当cigs=20(每天一包)时呢?评价其差别。
(ii)这个简单回归能够得到婴儿出生体重和母亲抽烟习惯之间的因果关系吗?请解释。
(iii)要预测出生体重125盎司,cigs应该为多少?
(iv)样本中在怀孕期间不抽烟的妇女比例约为0.85。这有助于解释第(iii)部分中的结论吗?
利用APPLE.RAW来验证6.3节中的一些命题。
(i)做ecolbs对ecoprc和reprc的回归,并以通常的格式报告结论,包括R²和调整R²。解释价格变量的系数,并评论它们的符号和大小。
(ii)价格变量统计显著吗?报告个别t检验的P值。
(iii)ecolbs拟合值的范围是什么?样本报告ecolbs=0比例是什么?请评论。
(iv)你认为价格变量很好地解释了ecolbs中的变异吗?请解释。
(V)在第(i)部分的回归中增加变量faminc,hhsize(家庭规模),educ和age。求它们联合显著的P值。你得到什么结论?
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
(i)有多少个州在1991年、1992年和1993年中至少处决了一个犯人?哪个州处决得最多?
(ii)利用1990年和1993两年的数据,做一个mrdrte对d93、exec和unem的混合回归。你如何解释exec的系数?
(iii)仅利用从1990到1993年的变化(对总共51个观测值),用OLS估计以下方程
并以通常的形式报告结果。现在,处以死刑是否看起来具有威慑作用?
本题使用CRIME4.RAW。
(i)在数据集中增加每个工资变量的对数,然后用一阶差分估计模型。问这些变量的引入如何影响例13.9中那些司法变量的系数?
(ii)第(i)部分中的工资变量都有预期的符号吗?它们是联合显著的吗?试解释。
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型, 并报告通常的标准误。为使得ai的期望值可以非零, 你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994~1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。