第2题
利用MEAP00 O1中的数据回答本题。
(i)使用OLS估计模型
并用通常的格式报告你的结论。在5%的显著性水平上,每个解释变量都是统计显著的吗?
(ii)求出第(i) 部分中回归的拟合值。拟合值的取值范围是多少?它与math4的实际数据取值范围相比如何?
(iii)求出第(i)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。
(iv)在方程中增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗?
(v)回到第(i)部分中的模型,将因变量和每个解释变量都除以各自的样本标准差,并重新进行回归。(除非你还将每个变量分别减去了各自的均值,否则还应该包括一个截距项。)以标准差为单位,哪个解释变量对数学考试通过率具有最大的影响?
第3题
漏变量。
(ii)如果样本中每名男性在1981~1987年之间都拥有相同职业,你在固定效应估计中还需要包含职业虚拟变量吗?请解释。
(iii) 利用WAGE PAN.RAW中的数据(包括方程中的8个职业虚拟变量) , 使用固定效应法估计方程。union的系数变化很大吗?其统计显著性如何?
第6题
利用CHARITY.RAW中的数据[得自于Franses and Paap(2001)] 回答如下问题:
(Ⅰ)在这个4268人的样本中,平均捐款数量是多少(以荷兰盾为单位)?没有捐款的人数百分比是多少?
(Ⅱ)每年平均寄出的邮件数量是多少?其最小值和最大值是多少?
(III)用普通最小二乘法估计如下模型:
按照通常的方式报告估计方程,包括样本容量和R²。
(Ⅳ)解释斜率系数。如果每封邮件的成本是1盾,那么慈善机构预期能够从寄出的每一封邮件中获得净利润吗?这意味着慈善机构从每封邮件中都获得了净利润吗?请加以解释。
(Ⅴ)样本中最小慈善捐款的预测值是多少?利用这个简单的回归分析,你有可能预测git等于0吗?
第7题
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
第8题
第9题
利用WAGEPAN中数据。
(i)利用混合最小二乘法(pooledOLS)估计一个log(ag为被解释变量的方程。以educ,black,exper,married,union以及一系列时间虚拟变量(以1980年为基年)为可解释变量,解释及讨论变量married和union的系数。
(ii)解释为什么通常(i)中标准误总是偏小。算出关于married和union两个变量对自相关和异方差一稳健的标准误。
(iii)现在对变量lwage,exper,married和union进行一阶差分。(不随时间改变的变量educ,black和hisp被排除在这个估计之外,exper也是,因为它总是随着年份增加。)注意排除首年即1980年的一阶差分,因为不存在更早的年份。
(iv)就作回归分析,确保包括一个常数项和一个从1982年到1987年的时间虚拟变量。算出Δmarried和Δunion的系数和标准误。
(v)对比婚姻状况和工会保费的估计水平及其一阶差分估计,并作相应评论。
第10题
:年龄x1,体重x2(单位:kg),1500m跑用的时间x3(单位:min),静止时心率x4(单位:次/mim),跑步后心率x5(单位:次/min)。对24名38至57岁的志愿者进行了测试,结果如下表。试建立耗氧能力y与诸因素之间的回归模型。
(1)若x1~x5中只许选择1个变量,最好的模型是什么?
(2)若x1~x5中只许选择2个变量,最好的模型是什么?
(3)若不限制变量个数,最好的模型是什么?你选择哪个作为最终模型,为什么?
(4)对最终模型观察残差,有无异常点?若有,剔除后如何?
第11题
(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)
(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?
(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?