QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1824|回复: 0
打印 上一主题 下一主题

时间序列中的标准和归一化

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-9-20 16:35 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
在时间序列分析中,标准化(Standardization)和归一化(Normalization)是两种常用的数据预处理技术,旨在提高模型的性能和稳定性。它们通过调整数据的范围和分布,使得不同特征之间具有可比性,尤其在使用机器学习算法时尤为重要。
/ R% A2 a% |' V+ @7 X  f/ X
# B' {, J; B/ n0 c7 v7 e' ~' |### 1. 标准化(Standardization)
2 o) G9 @% M; E9 C5 X# A0 f
# C: m8 x& C+ R" U, Q: d标准化是将数据转换为均值为0,标准差为1的分布。通过标准化,可以消除不同特征之间的量纲影响,使得数据在同一尺度上进行比较。1 {4 i4 }9 a2 L) U

) d) v! q; A8 C#### 标准化的公式- Z( \8 U9 A& o3 [  ~# x8 Z# A! G

8 L# \$ V8 n, q/ Z. q# u; X" Z对于一个数据集 \(X\),其标准化的公式为:
; `) F: w) J* Y/ d, V* Q2 B( W9 g\[- `5 X* M) a# Q4 F5 q  x/ x$ e
Z = \frac{X - \mu}{\sigma}
; d$ Y" p! K" I9 D; W\]# L1 ^; S* s# u% ]4 Z" r( @
其中:
( j% \9 M  j5 X  f# l; \- \(Z\) 是标准化后的值。
% }" j3 o( d" U" Y; P) R3 [8 @- \(X\) 是原始数据值。4 @7 D& J0 U: ]+ K4 q, k
- \(\mu\) 是数据的均值。
2 Z0 L2 M2 {/ v2 `( u* k- \(\sigma\) 是数据的标准差。1 M6 q' |. F  R) O* b
- q. l1 i$ Q$ K& M. b# e5 i
#### 标准化的特点- }: t9 S1 K& f' i/ }2 Y
  {/ E8 k3 g' R, E$ N5 U1 K1 j  k
- **适用场景**:适合于数据呈现正态分布或近似正态分布的情况。8 c6 O, _& b# a4 K) U* t
- **平衡特征**:通过消除均值和标准差的影响,使得不同特征在同一尺度上进行比较。
, s' _1 s* G4 P% ~* N' u- **对异常值敏感**:标准化对异常值敏感,异常值会影响均值和标准差的计算。
% c% Y2 l  L" J6 F$ ]1 T5 u; \& I. ?: o- X3 H1 C* V( r
### 2. 归一化(Normalization)
6 Z& n5 `& s4 T, }5 @1 P& n
- ]& c4 D4 {" H归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。归一化可以使得不同特征具有相同的尺度,尤其在特征值的范围差异较大时。6 J4 f. C1 t! R' a

; z" U- a  Q+ e5 |#### 归一化的公式+ {  |5 a( I$ y2 Q) E: F- I/ _
7 s9 B. ?& h) t4 S
对于一个数据集 \(X\),其归一化的公式为:- C2 ?0 P! w( X+ }; V3 l
\[1 }- m% M+ S5 p  X9 x) D5 t8 Y  E
X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}
% d( Y" W& c7 L6 i4 E\]
; }5 f- L) W; c* s/ o或者对于[-1, 1]范围的归一化:" J& W3 S- n9 d( o
\[, E# f' y( e* l8 u
X' = \frac{2(X - \text{min}(X))}{\text{max}(X) - \text{min}(X)} - 1
+ P9 r8 v" V* R6 J) K5 k* D\]
0 H. Y$ l5 V1 K5 l( k- y1 g其中:& K" w% O* l+ x+ l4 c
- \(X'\) 是归一化后的值。
* s/ _% e! M# E$ F  }. }. A- \(\text{min}(X)\) 和 \(\text{max}(X)\) 分别是数据集中的最小值和最大值。
: g# ^1 a+ F" B0 D$ i3 K: p$ y; D* g5 }1 L6 e5 p0 q; [' n" g+ ~; L$ x
#### 归一化的特点
8 K, T, Q) J3 T: m, ?/ o$ a( r- k# M0 B) h4 z  c
- **适用场景**:适合于数据没有明显的正态分布,并且特征值范围差异较大的情况。
' S: o1 f  I, B" H4 F6 H- **消除量纲**:通过将数据缩放到相同的范围,消除特征之间的量纲影响。7 I) ?) b& a6 H- Q; v# T8 A
- **对异常值敏感**:归一化也对异常值敏感,异常值会影响最小值和最大值的计算。7 _- k$ i' @& e: \
' |. {; Y- c2 [5 w
### 3. 标准化与归一化的区别
7 _1 \5 C' b  A) [  O6 @
0 _  C8 o6 _! o) R  R( i7 `| 特征          | 标准化                      | 归一化                      |
* ^( g* j$ ?. R) E|---------------|-----------------------------|-----------------------------|
3 g' l5 i  O* G; t| 目标          | 均值为0,标准差为1          | 缩放到特定范围(如[0, 1]) |
3 V9 X( A9 S8 Q  j| 适用场景      | 数据近似正态分布           | 数据范围差异较大           |
% V8 d% u0 r0 m5 S' i| 对异常值敏感  | 是                          | 是                          |7 {  n% W' d; y/ D/ m$ A1 o
| 公式          | \(Z = \frac{X - \mu}{\sigma}\) | \(X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}\) |1 K# x( q; |( S) o3 U9 W  u
3 U" D8 D( v! C' s. I% ~" q
### 4. 在时间序列中的应用
$ [. S6 O& E6 _4 J$ B1 W; W0 U3 b
在时间序列分析中,标准化和归一化可以用于以下几个方面:
/ q7 O" q1 K* {) `& R" R# v! f8 u+ p* g5 t' B
- **特征工程**:在构建特征时,标准化和归一化可以帮助提高模型的表现,尤其是在使用基于距离的算法(如KNN、SVM等)时。
7 i, b- x$ D  j9 {; E% z; x- **平稳性检验**:在进行平稳性检验时,标准化可以帮助消除数据的尺度影响,使得检验结果更为可靠。% E3 ^5 V/ D" x3 {
- **模型训练**:在训练机器学习模型时,标准化和归一化可以加速收敛,提高模型的训练效率。
6 R2 |/ I  W2 c6 Z8 }
6 S+ s0 ?; N/ G% b9 K3 S### 总结
7 Z2 a$ s" N0 g; }+ r8 N/ i* m( H, x  m5 v
标准化和归一化是时间序列数据预处理的重要步骤,能够提高模型的性能和稳定性。选择使用哪种方法取决于数据的特性和所使用的模型。了解这两者的区别和适用场景,可以帮助更好地进行时间序列分析和预测。/ B' ]' ~* P0 Y& P( z+ @
& J# x7 G4 c+ K( F! i- K2 x
/ H1 R8 z8 ?4 z% {" @0 C# c

- b2 l! B3 E; X, v

判断数据是否适用标准化.py

215 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

归一化.py

726 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

标准化.py

727 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

daily-minimum-temperatures-in-me.csv

62.82 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-10 11:43 , Processed in 0.404997 second(s), 55 queries .

回顶部