现有一组从美国1994年人口普查数据库抽取出来的数据,其中包含了年龄,工种,学历,职业,人种以及年收入等信息。你们需要通过其他的属性对年收入是否超过五万美元进行预测。- F& E2 l' J. t; r/ N
附录一是各属性的详细说明;附录二为训练集;附录三为测试集;有部分数据缺失,用“?”表示。1 j5 z2 K9 [9 F+ @8 L
问题一:根据附录二中的数据,只考虑连续型属性,提出判别美国居民年收入是否超过5万美元的方法,并检验你提出方法的正确性。按照所提出的方法,判断附录三中的200个居民的年收入是否超过5万美元。 # T1 h2 Q8 H R; ~问题二:考虑所有属性(包括连续型属性和类别型属性),提出判别美国居民年收入是否超过5万美元的方法,并检验你提出方法的正确性。按照所提出的方法,判断附录三中的200个居民的年收入是否超过5万美元。$ l" c. n, \# ~ v/ s z