在样本量为n,自变量个数为3的线性回归方程的假设检验中,回归变异和剩余变异的自由度分别为()。
A.3和n-3
B.3和n-4
C.2和n-2
D.2和n-3
A.3和n-3
B.3和n-4
C.2和n-2
D.2和n-3
A.进行回归系数的假设检验
B.在自变量取值范围内画出回归直线
C.建立线性回归方程
D.绘制散点图观察实测值是否有线性趋势存在
E.计算总体回归系数b的可信区间
A.生存分析
B.卡方检验
C.多重线性回归
D.方差分析
A.残差平方和SSe=19
B.判定系数R2为0.81
C.估计标准差为0.9
D.样本相关系数R为0.9或-0.9
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
A.某样本中,平均每月的广告费支出是$800,000;
B.当每月广告费支出处在平均值时,产品销售为$800,000;
C.平均来看,每元额外的广告费用可以能够导致销售增加$0.80;
D.广告不是销售的一个好的预测指标,因为系数太小了。
A.样本中,平均每月的广告费支出是$800,000。
B.当每月广告费支出处在平均值时,产品销售为$800,000
C.平均来看,每元额外的广告费用可以能够导致销售增加$.80
D.广告不是销售的一个好的预测指标,因为系数太小了。
A.回归算法是用来研究随机变量之间关系的算法
B.按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析
C.回归指的就是线性回归
D.如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多重线性回归分析
A.增加自变量后,模型包含的信息量增多,多重判定系数会随着自变量的增加而无限变大
B.增加自变量后,模型的预测误差会变小,从而减少残差平方和,此时回归平方和会变大
C.增加自变量后,各个自变量之前的相关关系更加紧密
D.增加自变量后,能使得所有自变量的系数显著