QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 862|回复: 0
打印 上一主题 下一主题

时间序列中的标准和归一化

[复制链接]
字体大小: 正常 放大

1171

主题

4

听众

2780

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-9-20 16:35 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
在时间序列分析中,标准化(Standardization)和归一化(Normalization)是两种常用的数据预处理技术,旨在提高模型的性能和稳定性。它们通过调整数据的范围和分布,使得不同特征之间具有可比性,尤其在使用机器学习算法时尤为重要。
/ }8 H& ]6 ?  X% g9 G
! Z& C! N  _& _" f3 o### 1. 标准化(Standardization)
- ?, f3 d6 f( G. Q: B# z, B$ n+ p5 B) C7 w( o
标准化是将数据转换为均值为0,标准差为1的分布。通过标准化,可以消除不同特征之间的量纲影响,使得数据在同一尺度上进行比较。- `( X  n$ m. v! ?' S: m) B5 Z; F

7 {4 `( m) J/ {/ I) C#### 标准化的公式. _% T2 c) |  C& y/ H: V' r; _6 ?
9 ~+ P( \  N3 i7 d
对于一个数据集 \(X\),其标准化的公式为:
1 l, w) Q, G/ T\[0 t$ v9 T4 B8 t7 G6 }' M  E+ o
Z = \frac{X - \mu}{\sigma}% _1 L3 _  m' U. K* B6 n
\]* W" b  q" y9 f* x; x
其中:
+ {* u9 Q: c0 v- \(Z\) 是标准化后的值。
+ _5 I. a7 ~8 t. T; f- \(X\) 是原始数据值。
- K7 N$ Y* ]& i' ~9 \( O- \(\mu\) 是数据的均值。
0 U; L. e3 F2 r- \(\sigma\) 是数据的标准差。
) P8 j9 y' V1 T% T2 U4 q, I% i5 K5 {0 O6 [
#### 标准化的特点3 i: U3 y: u. a0 w8 y( [
" }) w$ b8 z* U' ^! O6 ?
- **适用场景**:适合于数据呈现正态分布或近似正态分布的情况。# J6 C$ X  K2 U, u
- **平衡特征**:通过消除均值和标准差的影响,使得不同特征在同一尺度上进行比较。
8 U; W, f7 e6 f- k) ~! W& g- **对异常值敏感**:标准化对异常值敏感,异常值会影响均值和标准差的计算。% V. W: O: G- R

# s; R* U/ n& v: r3 a; F" o! R0 B  E### 2. 归一化(Normalization)& F: h+ u" l$ k7 f9 Q0 k
8 m6 L( T9 c8 y2 Q
归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。归一化可以使得不同特征具有相同的尺度,尤其在特征值的范围差异较大时。
7 M1 L8 [( m1 E- e; K" S( O4 N' J/ j1 W! }* @( S. o7 |; p
#### 归一化的公式& f( W  ~( j7 W) e/ l

3 X& Z3 `: N1 U对于一个数据集 \(X\),其归一化的公式为:# S# D* u6 H. H2 ^4 P2 [" [
\[
/ u6 e) w4 W/ }& g+ r% U1 i# \; Z0 }X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}0 l! S  _- i  o
\]0 x5 ~. d0 j+ a* \. C2 g1 s& X: d
或者对于[-1, 1]范围的归一化:* z& k+ V! n6 f! B& P& H
\[( X/ G! t- q- L) g) x+ _
X' = \frac{2(X - \text{min}(X))}{\text{max}(X) - \text{min}(X)} - 10 e% l) h+ L/ l- K4 T' U
\]
  z/ U% q- y9 P: k- b其中:
8 o2 t/ x/ V$ ]& C. d1 T$ t  ^- \(X'\) 是归一化后的值。
2 f$ e& j. e' j; ]) h" E( Y1 k- \(\text{min}(X)\) 和 \(\text{max}(X)\) 分别是数据集中的最小值和最大值。
  d1 W' q5 ~& R; {* o" c- f& ^  ]% F8 p. u0 g5 W3 Y
#### 归一化的特点) z' H3 d2 Z9 S1 j2 {$ b
3 ~9 j" t: U+ a5 [' k  B7 b1 L
- **适用场景**:适合于数据没有明显的正态分布,并且特征值范围差异较大的情况。
9 b' u9 A/ F! i5 C/ h- **消除量纲**:通过将数据缩放到相同的范围,消除特征之间的量纲影响。# |/ `0 h- t8 \/ ~" H
- **对异常值敏感**:归一化也对异常值敏感,异常值会影响最小值和最大值的计算。3 H2 j+ f: G) x( F- A5 }6 u
& Y8 S5 n' R) ]4 E; E6 T" ?% g4 H* _
### 3. 标准化与归一化的区别
) H' c# L3 B8 D+ S% m
$ Y4 j( l8 J4 H| 特征          | 标准化                      | 归一化                      |! \- s4 W. b3 H" a& `
|---------------|-----------------------------|-----------------------------|
) R7 S) B; a! Y, J7 D| 目标          | 均值为0,标准差为1          | 缩放到特定范围(如[0, 1]) |
: d" X1 D# o6 B| 适用场景      | 数据近似正态分布           | 数据范围差异较大           |
% n5 @5 J6 T2 G% {1 b0 s' E| 对异常值敏感  | 是                          | 是                          |6 e+ X" c6 Z. l
| 公式          | \(Z = \frac{X - \mu}{\sigma}\) | \(X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}\) |
) p- S7 x! f' k( ~9 N/ R% a9 h3 y. f4 E0 t7 ~& }
### 4. 在时间序列中的应用
# m, v+ P( v: k3 A! G3 u' n  C. X4 q  s- o
在时间序列分析中,标准化和归一化可以用于以下几个方面:% F- `( I: k. I1 U6 n! e
( q& d$ P# g$ m8 [/ O/ R
- **特征工程**:在构建特征时,标准化和归一化可以帮助提高模型的表现,尤其是在使用基于距离的算法(如KNN、SVM等)时。
0 G7 B* U4 Q5 d; s# y5 S- **平稳性检验**:在进行平稳性检验时,标准化可以帮助消除数据的尺度影响,使得检验结果更为可靠。" r5 ^" g) Z0 J, h. F( l7 N- [
- **模型训练**:在训练机器学习模型时,标准化和归一化可以加速收敛,提高模型的训练效率。
! N( K+ A7 |. i: t, a" m( ~3 p5 b- }" r) R5 K; ~+ A
### 总结: B* G6 D- C: F6 L  Z5 I* X  V% M. l
9 a: l! Z) T# Q1 s
标准化和归一化是时间序列数据预处理的重要步骤,能够提高模型的性能和稳定性。选择使用哪种方法取决于数据的特性和所使用的模型。了解这两者的区别和适用场景,可以帮助更好地进行时间序列分析和预测。
! f! c. j+ u  g8 F6 y* t  e2 m( k' W5 V, p4 S2 h; w

9 D3 H5 K( o' S) E% E, p. W1 J5 K) o3 x

判断数据是否适用标准化.py

215 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

归一化.py

726 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

标准化.py

727 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

daily-minimum-temperatures-in-me.csv

62.82 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2025-6-23 13:02 , Processed in 1.460946 second(s), 54 queries .

回顶部