假定你作为一个数据挖掘顾问,受雇于一家因特网搜索引擎公司,下列属于使用数据挖掘方法为公司提供帮助的是()。
A.使用聚类算法发现互联网中的不同群体,用于网络社区发现
B.使用分类对客户进行等级划分,从而实施不同的服务
C.使用关联规则发现大型数据集中间存在的关系,用于推荐搜索
D.使用离群点挖掘发现与大部分对象不同的对象,用于分析针对网络的秘密收集信息的攻击
E.使用人工查询公司网络故障信息,查找原因进行记录
A.使用聚类算法发现互联网中的不同群体,用于网络社区发现
B.使用分类对客户进行等级划分,从而实施不同的服务
C.使用关联规则发现大型数据集中间存在的关系,用于推荐搜索
D.使用离群点挖掘发现与大部分对象不同的对象,用于分析针对网络的秘密收集信息的攻击
E.使用人工查询公司网络故障信息,查找原因进行记录
(i)有多少个州在1991年、1992年和1993年中至少处决了一个犯人?哪个州处决得最多?
(ii)利用1990年和1993两年的数据, 做一个mrd rte对d93、exec和unem的混合回归。你对exec系数如何解释?
(iii)仅利用1990~1993年的变化(对总共51个观测值) , 用OLS估计以下方程
并以通常的格式报告结果。现在,处以死刑是否看起来具有威慑作用?
(iv)处决的变化至少可能部分地与预期谋杀率的变化有关, 因而△ exec与第(iii) 部分中的△u相关。假定△exec-1与△u不相关也许是合乎情理的。(毕竟, △exec-1 依赖于三年或更久以前进行的处决数。) 将△exec对△exec-1进行回归, 看它们是否充分相关:解释△exec-1的系数。
(v)用△exec-1作为△exec的Ⅳ, 重新估计第(iii) 部分中的方程。假定△mem是外生的。你从第(ii) 部分中得出的结论将怎样变化?
利用得自格雷迪(Graddy,1995)的数据集FISH.RAW。这个数据集也曾用于第12章的计算机练习C9.现在,我们用它估计一个鱼肉需求函数。
(i)假定每个时期均衡的鱼肉需求方程可写成
所以容许需求在一周中的每一天都有所不同。把价格变量视为内生的,一致地估计需求方程参数还需要什么额外信息?
(ii)变量wavet和wave3t度量了过去几天的海浪高度。为了在估计需求方程时将wave2t和wave3t用作log(avgprc)的Ⅳ,我们还需要哪两个假定?
(ii)将log(avgprc)对周工作日虚拟变量和两个浪高指标进行回归。wave2t和wave3t联合显著吗?这个检验的p值是多少?
(iv)现在,用2SLS估计需求方程。需求价格弹性的95%置信区间是什么?所估计的弹性合理吗?
(v)求2SLS的残差ut。在用2SLS估计需求方程时增加一个滞后ut-1记住,用ut-1作为自己的工具。需求方程误差中有AR(1)序列相关的证据吗?
(vi)给定供给方程明显取决于海浪变量,为了估计供给价格弹性,我们需要哪两个假定?
(vii)在log(avgprct)的约简型方程中,周工作日虚拟变量联合显著吗?你对能够估计供给弹性有何结论?
参考例13.9并利用CRIME4.RAW中的数据。
(i)假定你在做差分以消除非观测效应后, 认为log(pol pc)与log(crm rte) 是同时决定的; 特别是犯罪的增加与警察人数的增加有关。这对解释方程(13.33)中log(pol pc) 的正系数有何帮助?
(ii)变量tca pc表示全县人均征税量。将它排除在犯罪方程之外看上去合理吗?
(iii)在包括了潜在的工具变量log(tap c)后, 利用混合OLS估计log(pol pc) 的约简型。log(tax pc) 看起来是一个很好的备选IV吗?
(iv)假设在几年后,北卡罗来纳州资助某些县扩大其警察规模。你如何利用这个信息估计增加的警察对犯罪率的影响?
A.签到、外勤打开灯简单方便,节省了很多时间,让工作更有效率
B.员工出外勤,使用签到功能,企业管理考勤方便快捷
C.不仅通过业绩看人,也通过努力去识人,帮助努力的员工成长
D.员工通过对签到信息进行分析,可以总结自己需要提升和改善
利用JTRAIN3.RAW中的数据。
(i)估计简单回归模型re78=β0+β1train+u,并用常用格式报告结论。基于这个回归,1976年和1977年的工作培训看上去对1978年的真实劳动工资有正的影响吗?
(ii)现在使用真实劳动工资的变化cre=re78-re75作为因变量。(由于我们假定1975年之前没有工作培训,所以我们没有必要对train进行差分。也就是说,如果我们定义ctrain=train78-train75,那么,由于train75=0,所以ctrain=train78.)现在,培训的估计影响有多大?讨论它与第(i)部分估计值的比较。
(iii)利用通常的OLS标准误和异方差-稳健标准误求培训效应的95%置信区间,并描述你的结论。
A.业务理解(BusinessUnderstanding)
B.数据理解(DataUnderstanding)
C.数据准备(DataPreparation)
D.建模(Modeling)
E.评估(Evaluation)
F.部署(Deployment)
用到MROZ.RAW中的数据。
(i)用log(hours)作为因变量重新估计教材例16.5中的劳动供给函数。将估计出的弹性(现在是常数)与教材方程(16.24)在平均工作小时数处所得到的估计值相比较。
(ii)在第(i)部分的劳动供给方程中,容许educ因遗漏了能力变量而成为内生变量。用motheduc和fatheduc作为educ的Ⅳ。记住,你现在在方程中有两个内生变量。
(iii)检验第(ii)部分2SLS估计中过度识别约束。这些Ⅳ通过检验了吗?
作的时间之间是否存在替代关系。我们可以用它们中的任何一个作为因变量。为具体起见,估计模型
sleep=β0+β1totwrk+u
其中,sleep是每周用于晚上睡眠的分钟数,totwrk是这一周中用于工作的分钟数。
(Ⅰ)用方程的形式,连同观测的次数和R²报告你的结果。该方程中的截距表示什么?
(Ⅱ)若tot wrk增加2小时,则sleep估计要减少多少?你觉得这是一个很大的效应吗?
A.规划公司扩展计划和培训主要的公司管理者
B.制定持续发展计划并建立顾问委员会
C.确定健身课程安排和招聘俱乐部培训师和员工
D.迎宾接待顾客和为顾客提供健身训练服务正确