数学建模社区-数学中国
标题:
金融风控训练营TASK03学习笔记 学习知识点概要
[打印本页]
作者:
1440359316
时间:
2021-5-28 17:45
标题:
金融风控训练营TASK03学习笔记 学习知识点概要
学习内容
1、特征工程的概念和重要性
业界广泛流传这样一句话:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”,由此可见特征工程在机器学习中的重要性。具体来说,特征越好、灵活性越强,构建的模型越简单、性能越出色。
概念:特征工程就是从原始数据提取特征的过程,这些特征可以很好地描述数据,并且利用特征建立的模型在未知数据上的性能表现可以达到最优(或者接近最佳性能)。
特征工程一般包括特征使用、特征获取、特征处理处理、特征选择和特征监控。
特征工程的处理流程为首先去掉无用特征,接着去除冗余的特征,如共线特征,并利用存在的特征、转换特征、内容中的特征以及其他数据源生成新特征,然后对特征进行转换(数值化、类别转换、归一化等),最后对特征进行处理(异常值、最大值、最小值,缺失值等),以符合模型的使用。
简单来说,特征工程的处理一般包括数据预处理、特征处理、特征选择等工作,而特征选择视情况而定,如果特征数量较多,则可以进行特征选择等操作。
————————————————
剩余代码请前往原文查看
原文链接:https://blog.csdn.net/zzm13798974259/article/details/116088176
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5