杨利霞 发表于 2021-1-17 16:03

人工智能选股之支持向量机模型

人工智能选股之支持向量机模型


本报告对各种核支持向量机模型以及支持向量回归进行系统测试
支持向量机(SVM)是应用最广泛的机器学习方法之一。线性支持向量机
能够解决线性分类问题,核支持向量机则主要针对非线性分类问题,支持
向量回归能够处理回归问题。本篇报告我们将对包括线性核、多项式核、
高斯核和 Sigmoid 核在内的各种核函数支持向量机以及支持向量回归进行
系统性的测试,并分析它们应用于多因子选股的异同,希望对本领域的投
资者产生有实用意义的参考价值。
支持向量机模型的构建:样本内训练与交叉验证、样本外测试
支持向量机模型的构建包括特征和标签提取、特征预处理、样本内训练、
交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期
上涨概率的预测值,然后根据正确率、AUC 等指标以及策略回测结果对模
型进行评价。我们还根据模型的预测结果构建了沪深 300 成份内选股、中
证 500 成份内选股和全 A 选股策略,通过年化收益率、信息比率、最大回
撤等指标综合评价策略效果。
高斯核支持向量机选股模型收益和信息比率的表现优于线性回归
对于沪深 300 成份股内选股的行业中性策略(每个行业选 6 只个股),高
斯核 SVM 模型的超额收益为 4.9%,信息比率为 1.22。对于中证 500 成份
股内选股的行业中性策略,高斯核 SVM 模型的超额收益为 9.0%,信息比
率为 2.37。对于全 A 选股的行业中性策略,高斯核 SVM 模型相对于中证
500 的超额收益为 21.1%,信息比率为 3.66。总体而言,高斯核 SVM 在
收益和信息比率方面表现不错,各种策略构建方式下都能稳定地优于线性
回归模型;最大回撤方面 SVM 模型相比于线性回归不具备明显优势。
高斯核支持向量机模型预测能力整体强于其它核支持向量机
我们比较了不同核支持向量机的预测能力,发现高斯核 SVM 的测试集正确
率、AUC 和回测表现普遍优于其它核函数。高斯核作为使用最为广泛的核
函数,其优势在于不对原始数据做太多的先验假设。我们的回测结果也印
证了这一点,通过交叉验证集调参,最终得到高斯核 SVM 全 A 选股模型
的测试集正确率为 56.25%,高于线性核(55.66%)、3 阶多项式核
(53.75%)、7 阶多项式核(50.03%)和 Sigmoid 核(55.66%)。我们同
时发现支持向量机的回测表现优于支持向量回归。
风险提示:通过支持向量机模型构建选股策略是历史经验的总结,存在失
效的可能。


页: [1]
查看完整版本: 人工智能选股之支持向量机模型