QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1907|回复: 0
打印 上一主题 下一主题

时间序列中的标准和归一化

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-9-20 16:35 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
在时间序列分析中,标准化(Standardization)和归一化(Normalization)是两种常用的数据预处理技术,旨在提高模型的性能和稳定性。它们通过调整数据的范围和分布,使得不同特征之间具有可比性,尤其在使用机器学习算法时尤为重要。' V" p: F' H9 r1 r/ Z

" P! w- |1 {! \( S0 s4 {### 1. 标准化(Standardization)* o5 F+ B$ F- K. _2 l& X

8 \1 ^& \0 `( v8 W5 @6 m标准化是将数据转换为均值为0,标准差为1的分布。通过标准化,可以消除不同特征之间的量纲影响,使得数据在同一尺度上进行比较。2 U; }% p, u! h7 K
' \2 `2 l2 o# c, L) |" ]/ R2 I: ^+ F6 S
#### 标准化的公式
* a1 C. H  Z9 S/ `
' Z, F" V5 h1 ~' |' S对于一个数据集 \(X\),其标准化的公式为:
9 k3 {' z' s+ `3 s3 g\[) y/ d' U) w2 l- L* Z- E
Z = \frac{X - \mu}{\sigma}) s  U3 U2 l# D& p. _7 ^+ C
\]( V$ f  a3 J4 g0 q' y1 p
其中:5 ?# P% H0 O3 z
- \(Z\) 是标准化后的值。. Z; m3 v' {5 q8 z5 z& I" D0 v
- \(X\) 是原始数据值。. E' @  L/ L3 y/ S0 T
- \(\mu\) 是数据的均值。
5 n* }3 ?& i1 y2 `+ |/ M0 G+ y- \(\sigma\) 是数据的标准差。
3 q! R* x  O) ^. w: Q
7 @: W# `) M: ?8 ^0 Q7 u#### 标准化的特点  W& }* i5 s: X( H: V
6 a+ u5 ]2 o$ \" v. k9 k% ^
- **适用场景**:适合于数据呈现正态分布或近似正态分布的情况。
" l: y5 J; \0 @2 M/ Q- **平衡特征**:通过消除均值和标准差的影响,使得不同特征在同一尺度上进行比较。
9 \2 F' i& e" k8 ]9 ~- **对异常值敏感**:标准化对异常值敏感,异常值会影响均值和标准差的计算。2 F* J. V/ K3 D
& u' }% o6 Z: F3 L
### 2. 归一化(Normalization)
# Z: n* O* c. [: x( H! {. Z4 w
) n, B. e8 u; R/ F5 w5 F' N归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。归一化可以使得不同特征具有相同的尺度,尤其在特征值的范围差异较大时。: H! O, L8 }" C$ @, n
5 w4 {. H  p/ u( [
#### 归一化的公式
. n# f  V$ K, [# Z! u
4 V# P  b9 ^8 g7 R' P5 F+ m对于一个数据集 \(X\),其归一化的公式为:2 T  K% {, V: G
\[7 d  K+ j: w* N4 r  }( _4 n% l$ R8 r
X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}
; k1 O0 `7 e. B1 {\]
2 h+ _4 }4 b* f$ c# k或者对于[-1, 1]范围的归一化:
. L! E5 g, c! c% k- F\[
9 [; p; R! Y% p3 F) J" E5 \X' = \frac{2(X - \text{min}(X))}{\text{max}(X) - \text{min}(X)} - 1
9 [( X/ ^/ x. @0 ~, C\]
, t3 @5 N! A4 J: H# P0 x其中:
/ f& r  ^2 ]: j9 Q; }- f- \(X'\) 是归一化后的值。
4 O7 w6 X6 }$ \$ P# S/ J- \(\text{min}(X)\) 和 \(\text{max}(X)\) 分别是数据集中的最小值和最大值。7 M* Z! `9 J$ `1 |" J0 j: C/ r
8 _8 [  E0 C5 ^( q
#### 归一化的特点
  j& D; O5 g" ]1 d
0 }- v% j' y  V7 H- **适用场景**:适合于数据没有明显的正态分布,并且特征值范围差异较大的情况。
, ]* n5 q7 [5 K  h5 O- **消除量纲**:通过将数据缩放到相同的范围,消除特征之间的量纲影响。
/ T$ G) F& g/ r) i+ s3 M- **对异常值敏感**:归一化也对异常值敏感,异常值会影响最小值和最大值的计算。
8 p4 z* k1 I' V4 W# q" Z- `$ m0 J3 p6 f+ r
### 3. 标准化与归一化的区别4 `2 L1 T- {" _8 c

2 H; T; ~( p4 h| 特征          | 标准化                      | 归一化                      |
  |* s4 h7 [; D5 G) H|---------------|-----------------------------|-----------------------------|
5 k9 @' y7 m. F. V+ u| 目标          | 均值为0,标准差为1          | 缩放到特定范围(如[0, 1]) |7 E, c& G( K9 b2 W  A& R
| 适用场景      | 数据近似正态分布           | 数据范围差异较大           |6 h; o1 q+ [# ^9 _
| 对异常值敏感  | 是                          | 是                          |2 @( I% M. A5 D* o# l- s6 Q
| 公式          | \(Z = \frac{X - \mu}{\sigma}\) | \(X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}\) |
) U+ j2 ^4 i; u: W/ q  E3 Z& M8 @& n- l. l' b6 B6 \; f
### 4. 在时间序列中的应用# T, z5 H* z# {( y

7 j$ |; Z- Z5 X; g3 g在时间序列分析中,标准化和归一化可以用于以下几个方面:
( f1 A9 n6 O: Q( d# t5 \2 S- P, z# ^1 F8 }3 ^1 i  {
- **特征工程**:在构建特征时,标准化和归一化可以帮助提高模型的表现,尤其是在使用基于距离的算法(如KNN、SVM等)时。
8 @: M1 K$ j  G' m- **平稳性检验**:在进行平稳性检验时,标准化可以帮助消除数据的尺度影响,使得检验结果更为可靠。
3 r. q( k$ Q3 Z5 C, Q. c4 Z& K! f" R- T- **模型训练**:在训练机器学习模型时,标准化和归一化可以加速收敛,提高模型的训练效率。$ \' R- y+ R' o5 G* v; @
" c6 c7 W. a& g  ^
### 总结) i- {  p6 M. }6 L# S# D- b

0 l( o/ `+ X: y" k标准化和归一化是时间序列数据预处理的重要步骤,能够提高模型的性能和稳定性。选择使用哪种方法取决于数据的特性和所使用的模型。了解这两者的区别和适用场景,可以帮助更好地进行时间序列分析和预测。
6 g) p9 n& \6 y
: O& Z. c; h+ l: c9 \/ H2 B1 x- G2 j% [" A
) f) z2 V& b# V" x# i4 w0 Q

判断数据是否适用标准化.py

215 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

归一化.py

726 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

标准化.py

727 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

daily-minimum-temperatures-in-me.csv

62.82 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-20 03:00 , Processed in 0.555630 second(s), 55 queries .

回顶部