现实世界中的数据科学:基于领域知识和监督学习模型的黄金价格理解与预测本文将展示如何建立一个简单但是强大的金价预测模型,主要包含以下内容:
6 `* u1 j# Z f7 T( b W1 f1 R) P. {4 k" W2 ~$ U
黄金的简要历史5 |% R: }' i# s2 j% s
影响金价的若干因素
# g; Y) N- x3 e% _$ a建立用于预测金价的回归模型
" l4 I! Y8 [8 q/ `2 W利用回归模型来辅助投资决策
2 C j0 h9 B( i% X$ X7 Y `5 @人类为何需要黄金?
; O ^5 T% N4 G( O5 R" ~! E4 g3 h; t. {6 ^ k& k$ A& u
大约公元前3600年,黄金首先在古埃及被采掘冶炼。经历30个世纪之后,在土耳其西部的一个古王国铸造出世界上第一枚金币,此后黄金便作为王国内的一种实物货币进行流通。
0 T3 L3 T& r s: N5 W' j6 E1 D/ ~( U2 a! ~. ^
在现代,黄金已经从实物货币演变为货币储备。1819年,英国正式采用有史以来第一个金本位制,将其货币与黄金挂钩。到1900年,除中国以外的大多数国家都采用了金本位制。然而,当第一次世界大战开始时,由于许多国家需要印钞来支付战争费用,金本位制最终被抛弃。
$ ~, d5 }) o9 F$ `
! v2 Y7 O. j9 K, N5 T; z今天,黄金在我们的生活中被用于各种各样的用途,如铸币、珠宝、电子产品和牙科治疗等。而货币政策和金融需求会对黄金价格产生实质性的影响。
0 y, [! x# I5 O& o: R% F4 Z
" P S' \* {! O0 b# S6 w金价的主要影响因素
# P m9 Y3 o) Z' J7 F3 j" U* m- d m1 e# M2 f+ W# H
从理论上讲,影响黄金价格的因素有很多,包括基本面因素、宏观因素和情感因素。从基本面看,央行、珠宝买家和 ETFs 对实物黄金有需求,而从宏观层面看,通胀、利率、货币供应和美元走强也会影响金价。此外,一些交易员跟踪 ETFs 的净头寸数据,以衡量投机者的情绪,消费情绪和投资情绪也会影响金价。
: `6 B* F( f, X. }8 ?7 ]" W
6 |6 J2 i* J6 T9 p6 z+ G
% D7 P, u( V/ C% y Y各因素对金价的相关性( u2 l3 u' h/ n- I( \
基本层面因素的影响最容易理解。政府和民众购买的黄金越多,市场上的黄金就越少,价格应该会攀升。
' ~* {0 w. S# y% s6 _
9 J- O! j; d2 N& b2 {7 W0 }在宏观层面,通货膨胀率(通货紧缩率)是衡量一篮子商品和服务价格上涨(下降)的指标。如果通货膨胀率上升,我们午餐和黄金的价格也会上升。相反,如果利率上升,黄金作为一种投资工具相对于美国国债来说就变得没有吸引力。; V M' Q6 g" ^2 _( }" [, T
0 @7 O( M9 T& |1 W
最重要的因素之一是货币供应量,它衡量一个经济体中可用的货币总量。让我们举两个例子来解释为什么货币供应量的增加会提高黄金价格:
, r4 D& G: }% O9 Y5 f" v3 _6 A2 [0 G+ }7 D: F5 o
想象一下你和你的朋友之间的一个小经济体,他们同意用你的货币资金买卖彼此的黄金。如果你开始在你的车库里制造货币资金,并开始从你的朋友那里购买所有的黄金,那么黄金相对于货币的价格将会上升。换言之,如果美联储开始印上数吨美元,黄金相对于美元的价格可能会攀升。* Y+ r( z5 T) z) K
# o" }& ^% u! C* E9 Z# o再想象一下你和你的朋友之间的小经济体,他们用美元进行交易。如果你印钞票,给每个人免费的钱,商品和服务的价格将增加,因为免费的钱将用于购买额外的商品和服务。货币供应量的增加最终导致通货膨胀率的上升,因此黄金价格可以上涨。
: I0 a# G0 }# R1 Q ]+ s
2 m# a4 T( O7 D6 { u总之,美元的强势会影响黄金和其他以美元计价的大宗商品的价格。如果美元变得疲软,其他国家可以购买更多的美元,然后购买更多的黄金,从而推高黄金价格,以及其他以美元计价的商品。
_0 P) q+ P4 U& a4 Y) T! s. k) }7 e6 f8 }
如何建立预测金价的模型呢?
0 ~( W5 E- @9 s) b
: z9 Z6 x7 R8 h9 H0 x+ o为了对黄金价格进行建模预测,我们首先收集输入数据并对其进行转换等预处理。利用转换后的数据,我们使用线性回归模型来解释影响因素与金价之间的关系。为了验证模型,我们进行了样本外的回溯测试,并计算了 R2 R^2R % {) k3 T+ Y5 {6 \% _2 N
2
V! V! k# ]7 @& b0 o! V! y) S' n 值来衡量模型的性能。
& F/ }- @, f" k3 H; S3 N9 e7 r7 B: G8 T, e% |& C; M
数据收集* x# U& Q9 M8 P1 Z8 H$ [$ M
6 Q7 c, j" r% t j$ ?6 _本文主要收集了 1981 年以来的以下数据:
0 A) V% |( a5 y8 B1 n- s2 S) e
! @7 ?/ u" n; RXAUUSD:以美元计价的黄金现货价格。
# U& `' Y( I0 {# R5 _ A美国CPI指数:该指数跟踪城市消费者支付的商品和服务价格的变化(即通货膨胀率)。
& U# }; {8 P p: X, z美国M2指数:包括现金、支票存款和易于兑换的货币在内的货币供应量。
# w% G" u5 r8 r* l8 b! @美国GDP:该指标衡量美国经济产出的规模。
" x! H# Y; K3 K# r/ y/ L" h* C+ C美元指数:美元相对于一篮子外币的价值的指数。
7 h9 @8 n r3 C* I: y
) @) h+ Z: C4 N$ e* {
. ]- h/ _* W3 I+ J3 w' g5 j8 S5 k' K$ M$ g
2 k) @( T8 }, I2 u0 ~3 ]8 O. O, W9 g' S" f+ K! @9 z- F/ L
数据处理&特征工程
$ Y" U/ A. Z1 f5 G' t3 p
. {0 F; W4 m; B% {4 j目标变量
4 \1 I' A8 f5 ?' ~: o i* b p2 T! s' v9 Y2 }$ _7 Y' @+ K+ @4 d% W
该回归模型的目标变量是经通货膨胀调整后的黄金现货价格。即经过 CPI 平滑处理后的黄金现货价格时间序列(XAUUSD)。3 @9 Y4 @4 ^0 l V
' Q- x. j3 S$ x! ?4 l预测因子; H, X3 R, J6 F8 Y% K
0 _6 H- _' ?# E5 H
该回归模型有两个预测因子:货币供应量占GDP的比率(M2/GDP)和美元指数(DXY)。货币供应量与GDP之比这一指标优于货币供应量,因为它是衡量经济中货币供应量过剩的指标。
2 V. G1 R) m3 W o q0 c U# E+ m& Z8 g
对数变换4 c/ D5 C9 \& g/ R
3 B5 Q! u: ~* q在上述两个变换之后,我们对目标变量和预测因子应用对数变换。因为所有的值都是正的并且显示出很高的正偏度,对数变换有助于后面线性模型的应用。6 J3 [+ S" m0 I! Y/ y, R
; E' t0 r2 W) t6 U目标变量和预测因子之间的相关性矩阵# @ L& ?. j% S2 V E# g' d( Y
利用转换后的变量,我们绘制一个相关矩阵来了解黄金价格与预测值之间的线性关系。如图所示,黄金现货价格与货币供应量占GDP的比例高度相关,与美元指数存在一定的负相关关系。
3 A1 N5 m+ ^$ S
5 Q2 W0 F/ R; b- \1 Z& N! |3 x
黄金价格 VS M2/GDP* u) V ] M( |' f6 E
更重要的是,这两个预测因子几乎不相关,两者的相关度只有 -0.08。这表明,尽管美元指数的相关性小于货币供应量与GDP比率的相关性,但美元仍然是有用的,因为它可能会添加不重叠的信息。 模型训练&回溯测试性能
8 S9 m9 {9 A) b1 T. c2 d( X+ |6 b
1 g% @" M( E1 L4 ?6 t n现在针对预测因子和目标变量,我们通过线性回归、岭回归、套索回归、随机森林、XGBoost等方法拟合黄金价格。1 q7 N9 P; [2 u' B7 {
为了对模型进行评价,采用100个季度的滑动窗口对模型进行反复训练,并预测下一季度的平均金价,进行了样本外的回溯检验。最后,将预测值与实际值进行比较,计算出R2 R^2R 2 i0 Y. O7 `. P: q' |
; l5 u/ c& n1 c% q
' F3 V7 ] d' R* w4 d
9 }& _; {8 |8 {. A; S
2 Y3 D) G0 u: \8 M! R2 v金价线性回归方程' F- W3 i! b0 Z
各方法的结果如图所示。
8 h/ y4 e5 T" B1 m预测模型的性能9 z/ b; k* Z! X4 b! z' L9 p( a
R 2是决定系数,表示模型可以解释的总变化百分比。因此,这个简单的线性回归模型可以解释高达92%的黄金价格总变化。
2 q3 A& c2 d: a4 o/ a K对比其它方法可以看到,线性回归模型的性能优于其它更为复杂的模型。. Z: h9 J* t0 U2 l; m$ W' w
9 ]6 C/ X" x+ Y( k
如何利用训练好的预测模型?
$ K2 b) C& W, t! y
: T' ~. H. [5 b利用该模型,我们可以分析货币供应量、GDP、美元指数等因素对黄金价格的影响,从而预测黄金价格。
6 B# e. u! o3 \7 I* c! h W4 H* L8 \# F8 {9 }8 @; q; G
由于各国政府未抵消全球封锁的影响和信贷市场的担忧情绪将持续印钞,货币供应量与GDP的比率在短期和长期都将增加。
2 _! r8 a5 _: L不过,美元指数可能会因避险需求而出现一定程度的走强。当市场出现抛售时,对美元等避险资产的需求增加,美元走强。
% ]$ f! `# w' X7 ?) d" L+ s5 a: e
8 }( W" t$ A R0 v0 W综合这些因素,预计黄金价格在短期内将保持相当大的波动,因为这两个预测因素可以相互抵消。不过,从长期来看,相信期待已久的牛市行情将卷土重来。
1 g' Y3 }* {8 n
0 K$ I& H" @4 @( ~/ j作者:Alex Kim% h- x% A7 f" d$ o8 ^
6 [( s/ l9 H) k; F; U$ A" @" [- i
https://github.com/ayh9kim/Commodity/blob/master/Gold/Gold%20Price%20Model%20-%20Version%201.0.ipynb
+ n. Y; W7 M3 T! }" z4 g, g" [+ I7 ~8 v
deephub翻译组 oliver lee. o& m6 @, @3 }" [# G
版权声明:本文为CSDN博主「deephub」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
, v" {' v% R( b$ Y6 k原文链接:https://blog.csdn.net/m0_46510245/article/details/106035057
* g k- j, q: ?" b2 E# V, e5 i7 |6 M7 V# b+ Q
4 S1 p! X6 L; Y8 |: |9 F4 v1 r& W" C3 p. J
|