QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1905|回复: 0
打印 上一主题 下一主题

时间序列中的标准和归一化

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-9-20 16:35 |只看该作者 |正序浏览
|招呼Ta 关注Ta
在时间序列分析中,标准化(Standardization)和归一化(Normalization)是两种常用的数据预处理技术,旨在提高模型的性能和稳定性。它们通过调整数据的范围和分布,使得不同特征之间具有可比性,尤其在使用机器学习算法时尤为重要。# a) N0 M$ Z3 ?$ A' f$ ^
. ?" e6 J' x8 j# q
### 1. 标准化(Standardization)/ y% T9 `+ o6 ^, ?& N

, g" V$ u* `# K$ y$ Z* _标准化是将数据转换为均值为0,标准差为1的分布。通过标准化,可以消除不同特征之间的量纲影响,使得数据在同一尺度上进行比较。
3 n% N# I; @. k
; Z8 E# \; T; F9 b1 X/ u& Y# A#### 标准化的公式; j* v# `# r( S3 K! E+ n( F9 S7 D
9 U0 z8 N6 s( S: f/ F, O
对于一个数据集 \(X\),其标准化的公式为:+ ]2 Y! L& [" |1 D
\[/ f3 V- O" S; j4 ]6 r: ]3 F
Z = \frac{X - \mu}{\sigma}
4 J+ a8 y( g- \5 i6 g5 C\]
/ H% O- Y/ n  `( f8 S/ Q' Y9 R其中:
1 h& r6 K( a4 e$ o6 _- \(Z\) 是标准化后的值。3 _+ N8 l5 n, a% n2 j; T: c
- \(X\) 是原始数据值。. u' }5 t; S; l. j  J1 m# Y
- \(\mu\) 是数据的均值。
# R* _# p4 h* n8 \- \(\sigma\) 是数据的标准差。/ ]% H4 |0 a/ Y) c! i# Z( y
/ |- `5 K( J6 S. I
#### 标准化的特点: O6 v) }7 F0 `! [
( B( O; t0 Y( L8 X- q5 C
- **适用场景**:适合于数据呈现正态分布或近似正态分布的情况。% R" G7 X* e! W% f
- **平衡特征**:通过消除均值和标准差的影响,使得不同特征在同一尺度上进行比较。
" O& A' K1 w8 |2 e; L- **对异常值敏感**:标准化对异常值敏感,异常值会影响均值和标准差的计算。
3 W" Z9 s/ Q/ G& ~) ^& o
! S* [5 _, z: ^& x6 i### 2. 归一化(Normalization)
/ |* `' z8 v! \$ Y3 v/ W7 P! h
8 ]; p* w- _# T归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。归一化可以使得不同特征具有相同的尺度,尤其在特征值的范围差异较大时。
# I" q, O2 G( V! I7 g
# P/ W+ E2 A+ u7 z& t5 y#### 归一化的公式
/ W; H' h9 v) c5 B- f% Q
; N' [6 v. A+ J! F: G对于一个数据集 \(X\),其归一化的公式为:
. }* y. P+ I+ u2 s' H: ]\[$ G$ y6 Q  t8 _6 d; u; \& o
X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}( L( z9 @" k% @1 R
\]" H+ `/ b! l- j5 |1 |1 ?
或者对于[-1, 1]范围的归一化:
. ]7 Y! s# \1 K; e# j% ?' U. Z: S\[& d+ l& }  |+ d: B9 r
X' = \frac{2(X - \text{min}(X))}{\text{max}(X) - \text{min}(X)} - 1
; \/ g. X8 o# U- K: C\]
# r+ w4 z  r4 N$ u: t7 Q' Y1 X6 n1 L1 Y其中:6 M, ~3 ]9 @' w9 o0 I# ^4 @- R" {
- \(X'\) 是归一化后的值。
$ P, R" o& W2 g. f, k: o6 H' G2 k# @- \(\text{min}(X)\) 和 \(\text{max}(X)\) 分别是数据集中的最小值和最大值。
) j2 p9 i$ C( f1 ^# _9 G+ ~) a
8 m5 }8 g. o1 {#### 归一化的特点* A5 g$ E1 Q0 P1 s7 ?9 _
9 o  Z1 [  z0 Z, Q$ X
- **适用场景**:适合于数据没有明显的正态分布,并且特征值范围差异较大的情况。
, @; p$ m* s5 z- **消除量纲**:通过将数据缩放到相同的范围,消除特征之间的量纲影响。
$ M, O2 ~4 i& S/ p- S/ C' p- **对异常值敏感**:归一化也对异常值敏感,异常值会影响最小值和最大值的计算。
6 m' [8 ?* v- U  ^
  a/ U1 M+ }( t9 t### 3. 标准化与归一化的区别
" g4 D6 x) @/ o7 g/ r5 k7 y
9 _$ O  ?3 {% U* A# a| 特征          | 标准化                      | 归一化                      |
- T8 ~& h' A7 J" X|---------------|-----------------------------|-----------------------------|
$ X, G& \1 u+ P| 目标          | 均值为0,标准差为1          | 缩放到特定范围(如[0, 1]) |
$ o7 @# g7 _4 Q2 {' I| 适用场景      | 数据近似正态分布           | 数据范围差异较大           |
- l% t6 y, A4 c8 w: j8 ?/ l| 对异常值敏感  | 是                          | 是                          |
: i% u% y& |- c& h+ F| 公式          | \(Z = \frac{X - \mu}{\sigma}\) | \(X' = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}\) |
% p6 X5 p$ W7 B; J# K
' U, x# O, X$ \' O. s$ [" D### 4. 在时间序列中的应用
: M& l0 |8 \/ @+ i" E# X: n' l( L2 X
在时间序列分析中,标准化和归一化可以用于以下几个方面:
: x" w! b5 ~7 z/ W3 L1 }6 c2 x9 }* ^' p: A: ]& @* O3 L" a
- **特征工程**:在构建特征时,标准化和归一化可以帮助提高模型的表现,尤其是在使用基于距离的算法(如KNN、SVM等)时。5 x+ R* U6 Z$ N- j8 O/ Q, `4 V
- **平稳性检验**:在进行平稳性检验时,标准化可以帮助消除数据的尺度影响,使得检验结果更为可靠。
, n5 a4 r- z( O" Y- **模型训练**:在训练机器学习模型时,标准化和归一化可以加速收敛,提高模型的训练效率。
: `# B: D- ?" t5 |4 r% U" n' j% A9 S6 K9 q
### 总结' O8 Y4 c+ E' m  I% F& {
& s4 n9 ]( @. \- v
标准化和归一化是时间序列数据预处理的重要步骤,能够提高模型的性能和稳定性。选择使用哪种方法取决于数据的特性和所使用的模型。了解这两者的区别和适用场景,可以帮助更好地进行时间序列分析和预测。" X* q4 u; C4 i* r! O  L& u* v

! Z" y: ]4 Q: k( }- A: j
' X5 b% O. R( F2 w2 l/ P: @/ n9 Z) z" C: q4 x1 x: A  b

判断数据是否适用标准化.py

215 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

归一化.py

726 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

标准化.py

727 Bytes, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

daily-minimum-temperatures-in-me.csv

62.82 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 1 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-20 00:11 , Processed in 0.429834 second(s), 56 queries .

回顶部