QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2386|回复: 1
打印 上一主题 下一主题

[建模教程] 灰色系统理论及其应用 (一) :灰色系统概论、关联分析、与传统统计方法的比较

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2020-5-27 09:58 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    灰色系统是部分信息已知而部分信息未知的系统,常常采用离散模型,建立一个按时间逐段进行短期分析的模型。其中的关联度分析方法,根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度。此外的灰色模型GM和离散形式的灰色模型DGM也在博文中有介绍。  P# d- ~: m# f. Y2 H2 L
    # P7 I: p' [% _
    1   灰色系统概论
    ' L9 c* U: C; v: S: u客观世界的很多实际问题,其内部的结构、参数以及特征并未全部被人们了解, 人们不可能象研究白箱问题那样将其内部机理研究清楚,只能依据某种思维逻辑与推断来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。本章 介绍的方法是从灰色系统的本征灰色出发,研究在信息大量缺乏或紊乱的情况下,如何 对实际问题进行分析和解决。1 z% ~- E0 |; t3 c  e
    7 e& U4 c" _1 N6 a: L1 w
    客观世界在不断发展变化的同时,往往通过事物之间及因素之间相互制约、相互 联系而构成一个整体,我们称之为系统。按事物内涵的不同,人们已建立了工程技术、 社会系统、经济系统等。人们试图对各种系统所外露出的一些特征进行分析,从而弄清 楚系统内部的运行机理。从信息的完备性与模型的构建上看,工程技术等系统具有较充 足的信息量,其发展变化规律明显,定量描述较方便,结构与参数较具体,人们称之为 白色系统;对另一类系统诸如社会系统、农业系统、生态系统等,人们无法建立客观的 物理原型,其作用原理亦不明确,内部因素难以辨识或之间关系隐蔽,人们很难准确了 解这类系统的行为特征,因此对其定量描述难度较大,带来建立模型的困难。这类系统 内部特性部分已知的系统称之为灰色系统。一个系统的内部特性全部未知,则称之为黑 色系统。
    8 j4 q# X1 i% z6 j5 f- V- ]5 j/ O$ u5 j9 g4 e8 e  @
    区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系。 运动学中物体运动的速度、加速度与其所受到的外力有关,其关系可用牛顿定律以明确 的定量来阐明,因此,物体的运动便是一个白色系统。
    1 b$ E  ~9 u! z+ S( m5 v; S- i' |) c- I: U( _9 B; g& Z/ q
    当然,白、灰、黑是相对于一定的认识层次而言的,因而具有相对性。某人有一 天去他朋友家做客,发现当外面的汽车开过来时,他朋友家的狗就躲到屋角里瑟瑟发抖。 他对此莫名其妙。但对他朋友来讲,狗的这种行为是可以理解的,因为他知道,狗在前 不久曾被汽车撞伤过。显然,同样对于“狗的惧怕行为”,客人因不知内情而面临一个 黑箱,而主人则面临一个灰箱。7 r/ {1 _& ]1 _$ i9 b/ W7 W2 c
    , l2 g) h5 S1 p
    作为实际问题,灰色系统在大千世界中是大量存在的,绝对的白色或黑色系统是 很少的。随着人类认识的进步及对掌握现实世界的要求的升级,人们对社会、经济等问 题的研究往往已不满足于定性分析。尽管当代科技日新月异,发展迅速,但人们对自然 界的认识仍然是肤浅的。粮食作物的生产是一个实际的关系到人们吃饭的大问题,但同 时,它又是一个抽象的灰色系统。肥料、种子、农药、气象、土壤、劳力、水利、耕作 及政策等皆是影响生产的因素,但又难以确定影响生产的确定因素,更难确定这些因素 与粮食产量的定量关系。人们只能在一定的假设条件(往往是一些经验及常识)下按照 某种逻辑推理演绎而得到模型。这种模型并非是粮食作物生产问题在理论认识上的“翻 版”,而只能看作是人们在认识上对实际问题的一种“反映” 或 “逼近”。2 U7 L% j, p5 p7 B& I! y7 \5 G
    $ ]8 g; `( m+ K: G/ H' }& F: |
    社会、经济、农业以及生态系统一般都会有不可忽略的“噪声”(即随机干扰)。 现有的研究经常被“噪声”污染。受随机干扰侵蚀的系统理论主要立足于概率统计。通 过统计规律、概率分布对事物的发展进行预测,对事物的处置进行决策。现有的系统分析的量化方法,大都是数理统计法如回归分析、方差分析、主成分分析等,回归分析是 应用最广泛的一种办法。但回归分析要求大样本,只有通过大量的数据才能得到量化的 规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难。回归分析还要求 样本有较好的分布规律,而很多实际情形并非如此。例如,我国建国以来经济方面有几 次大起大落,难以满足样本有较规律的分布要求。因此,有了大量的数据也不一定能得 到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析。另外,回归分析 不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象。
    * W5 q6 n& T1 K
    % C, Z' }: ~9 Q* k# ?灰色系统理论提出了一种新的分析方法—关联度分析方法,即根据因素之间发展 态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程 度。由于以发展态势为立足点,因此对样本量的多少没有过分的要求,也不需要典型的 分布规律,计算量少到甚至可用手算,且不致出现关联度的量化结果与定性分析不一致 的情况。这种方法已应用到农业经济、水利、宏观经济等各方面,都取得了较好的效果。
    ! x1 r) w3 L7 n3 s  A+ W" T% h
    + g  _4 E1 \* f' W0 I灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并 利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法 是采用离散模型,建立一个按时间作逐段分析的模型。但是,离散模型只能对客观系统 的发展做短期分析,适应不了从现在起做较长远的分析、规划、决策的要求。尽管连续 系统的离散近似模型对许多工程应用来讲是有用的,但在某些研究领域中,人们却常常 希望使用微分方程模型。事实上,微分方程的系统描述了我们所希望辨识的系统内部的 物理或化学过程的本质。# n2 r& t0 J- P0 [- u0 |4 E! L/ q0 e# c
    0 R/ D6 D7 @* N* U3 M$ \
    灰色系统理论首先基于对客观系统的新的认识。尽管某些系统的信息不够充分, 但作为系统必然是有特定功能和有序的,只是其内在规律并未充分外露。有些随机量、 无规则的干扰成分以及杂乱无章的数据列,从灰色系统的观点看,并不认为是不可捉摸 的。相反地,灰色系统理论将随机量看作是在一定范围内变化的灰色量,按适当的办法 将原始数据进行处理,将灰色数变换为生成数,从生成数进而得到规律性较强的生成函 数。例如,某些系统的数据经处理后呈现出指数规律,这是由于大多数系统都是广义的 能量系统,而指数规律是能量变化的一种规律。灰色系统理论的量化基础是生成数,从 而突破了概率统计的局限性,使其结果不再是过去依据大量数据得到的经验性的统计规 律,而是现实性的生成律。这种使灰色系统变得尽量清晰明了的过程被称为白化。" F( [* M4 a  C6 u9 x5 I
    4 f4 \. A$ c0 H1 O" O8 v" _
    目前,灰色系统理论已成功地应用于工程控制、经济管理、未来学研究、生态系 统及复杂多变的农业系统中,并取得了可喜的成就。灰色系统理论有可能对社会、经济 等抽象系统进行分析、建模、预测、决策和控制,它有可能成为人们认识客观系统改造 客观系统的一个新型的理论工具。) o0 I8 _, l% q6 z4 Z8 Z& \2 A1 a
    ! X8 x: h3 I7 H' {" j! y
    2 关联分析
    ! ]: C% T" n4 ^& W, k2 I0 F7 T大千世界里的客观事物往往现象复杂,因素繁多。我们往往需要对系统进行因素 分析,这些因素中哪些对系统来讲是主要的,哪些是次要的,哪些需要发展,哪些需要 抑制,哪些是潜在的,哪些是明显的。一般来讲,这些都是我们极为关心的问题。事实 上,因素间关联性如何、关联程度如何量化等问题是系统分析的关键和起点。 因素分析的基本方法过去主要采取回归分析等办法。正如前一节指出的,回归分析的办法有很多欠缺,如要求大量数据、计算量大及可能出现反常情况等。为克服以上 弊病,本节采用关联度分析的办法来做系统分析。- @$ x! b4 s2 `% Z- c

    $ V: m2 f5 f. \* g  _5 k2 \" o作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较分析。 所谓发展态势比较,也就是系统各时期有关统计数据的几何关系的比较。
    % [2 a- @. \: P& D) `, ]
    ( [$ F7 p7 D! V' x8 f/ y; t: B8 _' P# k# l

    % p1 `. v; J/ |* R3 N例如,某地区 1977~1983 年总收入与养猪、养兔收入资料见表 1。
    : {* A9 f4 @' V( u( \* E; r# m6 \
      \  L! r5 Z8 i1 M" j1 G6 T" y1 O7 G( X0 F: |/ m- o$ s
                                          表1:收入数据  
    5 z' y  V+ D+ B6 Y! b) H               1977  1978        1979        1980        1981        1982        1983
    - w! w1 Y- s7 @$ c/ C总收入        18        20        22        40        44        48        60+ z2 D) L' U0 r
    养猪        13        15        16        24        38        40        50& p( |3 K- [: P- B
    养兔        3        2        12        10        22        18        201 m1 Y; i0 r4 p) K  Q
    根据表 1,做曲线图 1。
    2 A$ H+ Y1 A" e# u' q0 X' h% @. _: I0 z* a6 }$ R
    - J/ }+ L  G8 q; b

    $ n7 t. E1 [9 @! E9 d3 z由上图易看出,曲线 A 与曲线 B 发展趋势比较接近,而与曲线 C 相差较大,因此 可以判断,该地区对总收入影响较直接的是养猪业,而不是养兔业。 很显然,几何形状越接近,关联程度也就越大。当然,直观分析对于稍微复杂些 的问题则显得难于进行。因此,需要给出一种计算方法来衡量因素间关联程度的大小。
    ! I* w+ K6 P" H, w& W1 j
    , Z* B+ X- z& R5 I2.1 关联系数的定义& l+ K% Y& e) Y9 C6 T- M
    定义2   选取参考数列   * C; w/ E3 b, b% c( S

    3 H) `+ O$ c+ d0 T+ a) J& D6 _  其中k表示时刻。假设有  m 个比较数列 ) c3 I( e) t2 H, o1 Y6 @- Z/ c

    " V4 R* x' ~- H4 l9 Q则称
    / X" T6 @7 e0 \7 Z/ l   为比较数列 对参考数列
    2 x; L0 m2 I; z& k4 l
    6 Y% @1 C( q6 V+ d4 @7 ]在k时刻的关联系数,  其中 为分辨系数;2 |# I, V2 j/ m: Q/ X' d

    ! I6 J% z; d! E称(1)式中    分别为两级最小差,、两级最大差。
    # u1 c# w' b- w( F6 d  g! v. E' X1 k; I- N+ z' S  n
    0 C1 v0 l* m1 r+ ]; ?

    $ I$ K1 C: M2 [  W0 ?; u一般来讲,分辨系数 ρ 越大,分辨率越大; ρ 越小,分辨率越小。
    ; V0 W7 L0 f" k7 z) [! r9 u3 o/ E; n( G; H) V
    公式(1)中的不能区别因素关联是正关联还是负关联,可采取下述办法解决这个问题。记, T0 t) L( [: q' o% g
    $ P: c* |+ y( v# k/ q% e! c  I4 ]
    2 ?) x9 x. l5 P  r

    ) C6 {: P' i5 H0 C% I: o则:
    $ Y. S! j( }! o7 R: f+ r; s  t3 I, W9 n
           【1】 当, 则 和   为正关联;" l0 ^% g2 ]3 O) x! g
    # y: K2 e/ t. F1 F: c- J
           【2】 当 , 则 和  为负关联;
    % c2 Y( p4 W& m1 _. N3 X8 Z6 Y$ m* W/ K* S7 [$ j
    (1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指 标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给 出
    - ~1 L0 e- V6 b
    # ^0 w, _, `2 O2.2 关联度的定义
    ; ^  n  B' P! C- [' N$ ~
    $ `: P+ ?8 }7 ^; }) |% x) P
    # U- C9 w0 i8 V- P5 y4 C- D& H. X" R" L2 p
    由(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,亦即把过于 分散的信息集中处理。利用关联度这个概念,我们可以对各种问题进行因素分析。考虑下面的问题。0 ^3 }: I" V4 _8 R) W7 C2 |
    0 I8 B1 s( j* C5 o
    例 1 通过对某健将级女子铅球运动员的跟踪调查,获得其 1982 年至 1986 年每年 最好成绩及 16 项专项素质和身体素质的时间序列资料,见表 2,试对此铅球运动员的专项成绩进行因素分析。% S$ o" k# ~( k+ k; ?, y
    ! Z; ?! \, S- f1 v; E! E

    ; {& `. L3 ~# Q  a! y4 F
    $ q$ T' K0 H! H* Z) [- ~/ T在利用(1)式及(2)式计算关联度之前,我们需对表 2 的各个数列做初始化处 理。一般来讲,实际问题中的不同数列往往具有不同的量纲,而我们在计算关联系数时, 要求量纲要相同。因此,需首先对各种数据进行无量纲化。另外,为了易于比较,要求 所有数列有公共的交点。为了解决上述两个问题,我们对给定数列进行变换。【参考 数据变换技术】/ l  G( u. W' N

    * c$ F7 U6 ]' H/ P4 C4 i: F$ V' F/ }2 u- W8 D* q! c) Y# D" M- A- }

      H! D/ r$ [) V5 R% s, {* h% j( s% X% P6 y8 E

    / W  b% f# ?( W+ m5 f+ f! m3 W! I. e为原始数列 X 的初始化数列。
      f$ m; ]+ D  r* K1 @
    # L9 a7 y4 p& [3 Y这样,我们可对表 2 中的 17 个数列进行初始化处理。注意,对于前 15 个数列, 随着时间的增加,数值的增加意味着运动水平的进步,而对后 2 个数列来讲,随着时间 的增加,数值(秒数)的减少却意味着运动水平的进步。因此,在对数列 15 x 及 16 x 进 行初始化处理时,采取以下公式
    6 l7 Y& p# p8 ]6 V" V; g' D6 h3 _6 g3 C( x
    & f. J, r5 _  X1 [( f- G
    & x' \, h2 m0 @. W
    依照问题的要求,我们自然选取铅球运动员专项成绩作为参考数列,将表 2 中的 各个数列的初始化数列代入(1)及(2)式,易算出各数列的关联度如下表(这里 ρ = 0.5 )。
    ' V. ]4 G( C8 o9 C: U& M* A# J# |  c3 A( M6 d; c* I9 a" k* I6 S3 ~9 Y2 V+ u" X0 Y- ]
    8 f  a4 G  U* T  ~5 Z; v

    ( {' e* j* E6 W( s% u计算的 MATLAB 程序如下:9 `2 s- E' Y, E

    3 n4 i3 x8 S5 ?' ~clc,clear
    ( V; H+ m4 Q. }6 e5 k' ~5 mload x.txt %把原始数据存放在纯文本文件 x.txt 中6 F" ^* h( B- q- c) y) [
    for i=1:15
    . b" y  s/ P& D0 S, ~; x; j, n x(i,=x(i,/x(i,1); %标准化数据
    3 a6 R; j* }0 T$ P1 J  `% vend8 q$ I5 A' M6 s9 T6 }/ L* i
    for i=16:17
    " f( `: M* \. Y6 p3 D* A x(i,=x(i,1)./x(i,; %标准化数据  B! M/ S) O7 i1 h; u
    end
    5 D& |& Q) d: }  N0 X7 t" tdata=x;
    # W. j' @% u8 R3 H7 D5 ln=size(data,1);5 Q+ C- G, K' k; Z3 W
    ck=data(1,;m1=size(ck,1);
    + T* }( M' y  O' |0 i1 `. {bj=data(2:n,;m2=size(bj,1);
    % _! q' E& w: l" h; afor i=1:m17 I4 ]1 M1 T/ `0 [1 l4 K; B
        for j=1:m2- w, T% `  Q0 z* w4 ]
            t(j,=bj(j,-ck(i,; : r: `4 s+ |9 S* P# V( D: k& u
            end3 L9 l1 w* S' N) x
        jc1=min(min(abs(t')));jc2=max(max(abs(t')));
    $ ]% [% B1 y1 `8 X1 ]    rho=0.5;& L+ x* A# [% N( Y; z" q$ @  |3 M
        ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2);
    ( i9 O; c0 h3 l8 V4 \    rt=sum(ksi')/size(ksi,2);- D+ N6 d4 N$ T
        r(i,=rt;" _0 O: l0 D# f# V* `' X
    end( A# O- B2 ?5 z8 t0 }5 e
    r9 P6 Z; F; V$ O* x$ Y  ~
    [rs,rind]=sort(r,'descend') %对关联度进行排序& e: o) c7 j8 [% `
    & P/ l5 F/ F! |9 ]# {6 K9 L8 y

    $ {) s( Z! @$ K# L

    由表 3 易看出,影响铅球专项成绩的前八项主要因素依次为全蹲、3kg 滑步、高翻、 4kg 原地、挺举、立定跳远、30 米起跳、100 米成绩。因此,在训练中应着重考虑安排 这八项指标的练习。这样可减少训练的盲目性,提高训练效果。

    3  总结:灰色预测法与传统统计方法的比较

    8 x. a9 o5 W; ]2 L! h9 p) r4 h
    ! @  ?( S* U4 k" V) c$ D
    ————————————————$ Q- Z; C/ `6 e% M6 w8 S
    版权声明:本文为CSDN博主「wamg潇潇」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    : F  a- o! c: R+ w5 s原文链接:https://blog.csdn.net/qq_29831163/article/details/89713032
    3 d# v% g: V' N- x! U+ H
    ( W3 d& P- f. A0 j$ n+ _$ }- [  ]: d; L& Q% B  Z* [
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    0

    主题

    3

    听众

    92

    积分

    升级  91.58%

  • TA的每日心情
    慵懒
    2020-5-25 19:07
  • 签到天数: 2 天

    [LV.1]初来乍到

    群组2019美赛冲刺课程

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-12 14:04 , Processed in 0.407764 second(s), 57 queries .

    回顶部