现有一组从美国1994年人口普查数据库抽取出来的数据,其中包含了年龄,工种,学历,职业,人种以及年收入等信息。你们需要通过其他的属性对年收入是否超过五万美元进行预测。 9 h8 r* V Q7 z' V! m, A5 y附录一是各属性的详细说明;附录二为训练集;附录三为测试集;有部分数据缺失,用“?”表示。, H u8 U. Y6 Q6 y
问题一:根据附录二中的数据,只考虑连续型属性,提出判别美国居民年收入是否超过5万美元的方法,并检验你提出方法的正确性。按照所提出的方法,判断附录三中的200个居民的年收入是否超过5万美元。 " Q# l. v: B6 M3 M2 D ^- |问题二:考虑所有属性(包括连续型属性和类别型属性),提出判别美国居民年收入是否超过5万美元的方法,并检验你提出方法的正确性。按照所提出的方法,判断附录三中的200个居民的年收入是否超过5万美元。 6 O {- |) Y$ a7 w H- c3 o- d, u0 h/ ~- v