QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1095|回复: 0
打印 上一主题 下一主题

时间序列中的标准和归一化

[复制链接]
字体大小: 正常 放大

1175

主题

4

听众

2838

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-9-20 16:35 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
在时间序列分析中,标准化(Standardization)和归一化(Normalization)是两种常用的数据预处理技术,旨在提高模型的性能和稳定性。它们通过调整数据的范围和分布,使得不同特征之间具有可比性,尤其在使用机器学习算法时尤为重要。
, ^4 l) s6 s. b$ e! C
- S6 U0 a+ E5 m8 x* ]; J4 M% i& Q### 1. 标准化(Standardization)$ a1 _; e% E) J9 f9 B( q/ J; s

* Y) Q5 F, `- z0 t标准化是将数据转换为均值为0,标准差为1的分布。通过标准化,可以消除不同特征之间的量纲影响,使得数据在同一尺度上进行比较。  T; K9 u2 \, `" A3 \7 s

# I: x# V# Y7 M- f#### 标准化的公式) J# x' w  r' A& l! w# w
8 @/ e0 u9 y0 a0 W
对于一个数据集 \(X\),其标准化的公式为:
8 e# q: Y/ C( W\[1 P* G* b7 N* i2 d/ v
Z = \frac{X - \mu}{\sigma}
( w9 ^0 s5 Q1 @( ~, E0 e\]
/ u+ v2 \- s8 @. y# o其中:
+ g( n0 O9 Z# Z- \(Z\) 是标准化后的值。1 I6 K& F3 u/ \+ \* u# k% U
- \(X\) 是原始数据值。' u8 J( r* L- s0 @
- \(\mu\) 是数据的均值。
  K' r2 b- ^) u0 G# V. k- \(\sigma\) 是数据的标准差。. U6 r. h! i! J$ n- q$ k
8 J+ ^: K, l* W" U, o  \; f- p5 f$ H
#### 标准化的特点; L. _* B. u) j
  Z4 S0 j3 p3 y- x0 w2 {
- **适用场景**:适合于数据呈现正态分布或近似正态分布的情况。
" `. H  a4 \, w- **平衡特征**:通过消除均值和标准差的影响,使得不同特征在同一尺度上进行比较。4 I6 _/ b" K  B# a
- **对异常值敏感**:标准化对异常值敏感,异常值会影响均值和标准差的计算。# m# x: H7 N9 ~

0 f  l2 T7 O* U### 2. 归一化(Normalization)6 ]+ n3 q/ H9 j% B$ k; V5 K
% I( H6 Q. R1 |4 Q( ?% d
归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。归一化可以使得不同特征具有相同的尺度,尤其在特征值的范围差异较大时。* R* _, ?# Z) y. i1 v$ P% ?1 H8 _
$ h) ~6 ~4 {* g8 W. L
#### 归一化的公式
' N/ E" S' B6 c1 P: N- K8 E6 {5 L& a- C2 ~5 V0 C
对于一个数据集 \(X\),其归一化的公式为:( g7 {" M! z$ N9 b7 ~5 [9 {
\[( s  C1 ]; A" v- |/ W# \
X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}8 R' b: X% m. |
\]
) D3 I- L& {( J' r1 C% Q# q或者对于[-1, 1]范围的归一化:
1 U' ]; @# a' }. Z3 m/ s, m\[5 [9 O3 `8 G+ g
X' = \frac{2(X - \text{min}(X))}{\text{max}(X) - \text{min}(X)} - 1: M- J9 I- u7 t$ p
\]
" J% {7 ]% ?: c- \+ w其中:, h; f" Z$ }; o, F2 S& p- `
- \(X'\) 是归一化后的值。& p+ X8 `; B  B/ i; b  {
- \(\text{min}(X)\) 和 \(\text{max}(X)\) 分别是数据集中的最小值和最大值。
# o; {! I9 `' c2 y3 D& j" E1 F2 W4 Z8 z6 F9 P( Z
#### 归一化的特点
5 r' U( [% l8 t) f* D9 n3 r3 e8 Q
- **适用场景**:适合于数据没有明显的正态分布,并且特征值范围差异较大的情况。
. B- y7 r9 \7 V' X) A  v" ^% `' S- **消除量纲**:通过将数据缩放到相同的范围,消除特征之间的量纲影响。
! `$ k6 b9 X; C+ F. d- **对异常值敏感**:归一化也对异常值敏感,异常值会影响最小值和最大值的计算。, |0 f, B/ z8 R5 _. \
8 r  ~( c* b6 E4 N0 M
### 3. 标准化与归一化的区别
$ @- c3 y: ~9 E2 R2 |4 g1 `) z9 s8 c9 I3 |
| 特征          | 标准化                      | 归一化                      |
7 u+ s$ c' D. ?5 q& h/ j|---------------|-----------------------------|-----------------------------|8 k/ E9 }/ _( {; ]& r3 B
| 目标          | 均值为0,标准差为1          | 缩放到特定范围(如[0, 1]) |
$ @: B6 Z) f3 R7 T| 适用场景      | 数据近似正态分布           | 数据范围差异较大           |! j2 a8 ?$ ~. s- `( I% V" e# F; I5 r/ G# k: t
| 对异常值敏感  | 是                          | 是                          |
* y+ F7 m1 k# }1 Z3 |" A4 _| 公式          | \(Z = \frac{X - \mu}{\sigma}\) | \(X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}\) |4 C: C+ `1 D! f8 y

6 ?7 L, T+ U# u# E$ M5 ^9 L' B### 4. 在时间序列中的应用
8 }9 {6 K+ [" x% S: y0 V$ q; `& `$ B* f# ^' F
在时间序列分析中,标准化和归一化可以用于以下几个方面:; ~: |0 g! J- d1 \+ Y3 X

5 d4 x+ S4 m7 ^% M' ]- **特征工程**:在构建特征时,标准化和归一化可以帮助提高模型的表现,尤其是在使用基于距离的算法(如KNN、SVM等)时。
, u' Y- v0 K# E" r4 l- **平稳性检验**:在进行平稳性检验时,标准化可以帮助消除数据的尺度影响,使得检验结果更为可靠。
* v) I  O1 ~: T( R+ [5 p- **模型训练**:在训练机器学习模型时,标准化和归一化可以加速收敛,提高模型的训练效率。( U4 R+ U% P5 s8 p* d* x
: z- _* x, [& t+ E; ^
### 总结
5 z* R+ z) W0 g# J2 L9 d7 m9 R1 y0 S, I- m7 h& b
标准化和归一化是时间序列数据预处理的重要步骤,能够提高模型的性能和稳定性。选择使用哪种方法取决于数据的特性和所使用的模型。了解这两者的区别和适用场景,可以帮助更好地进行时间序列分析和预测。; a: O7 Y2 ~) e% [" {3 E

' P) C& }! M; W- i# R; |/ t: G; l$ Q" I  }3 @% }: D" `

! Y  ?3 X3 l4 f3 m) {$ |

判断数据是否适用标准化.py

215 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

归一化.py

726 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

标准化.py

727 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

daily-minimum-temperatures-in-me.csv

62.82 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2025-7-26 21:13 , Processed in 0.701470 second(s), 55 queries .

回顶部