QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 7560|回复: 0
打印 上一主题 下一主题

2020全国大学生数学建模比赛C题总结

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2021-5-24 15:54 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    2020全国大学生数学建模比赛C题总结
    # C1 S! ^: z, K1 S6 j: k; R* @) b% M, ]9 `# w. ]
    首先瞎逼逼一番,吐槽一下题目和比赛经历,对这部分不感兴趣的可以跳过:
    ; l1 m  |. J, ]4 J" P虽然我是周六下午才开始做的… 总的比赛时间不到两天,不过好在一个人,不怕拖队友。至于题目,我第一眼就喜欢上了 C 题。我想,恐怕很多人都喜欢 C 题吧,因为赛后做了一个总结,发现学校选择 C 题的,比选 B、A 题的加起来还要多。3 l' o' g: U  ~3 L4 ~

    1 z2 u! V8 Y' f

    : U! `# _! }0 X2 w" ?为什么选择 C 题呢?因为有数据处理…, k. B8 }7 S! U  n8 t6 |) r5 G
    & B/ ~% B* F+ j% E' Q! a

    - k# F' C! k( D. _$ B8 s4 A所以无论它多难,我都选它,哈哈哈。3 \% n" m' N% a  y- s- [6 ^: ^

    ' J6 m0 p! Y9 i: r

    $ q2 P$ K5 k- A7 o. {, c( |仔细看这一题,它与机器学习好像有区别啊。说起机器学习,我会想到:; I0 n1 P+ j/ |, I

    8 P- n" ?5 ?8 H
    , P" d8 {* ^5 P0 ]$ I: w
    分类2 l, l* A  G: m" h1 ^
    回归
    " R* G' U& {( k5 m3 b) Z! O拟合2 y2 z1 [' `$ z9 a
    预测
    ) X; f4 G6 x+ c但是,这题… 好像不是一种,用数据拟合,然后再预测的问题啊(机器学习的通俗定义)
    $ }9 u! t1 H. a  Q7 A5 f$ U" z: ], g3 I/ X( M  i

    % u- t- U. D4 T/ G好吧,选都选了,只能硬着头皮上了。
      B! J9 L4 W) x8 f$ }% @8 b, Z* k8 X: O
    5 c4 V* R% E& c
    问题分析0 N8 Z5 E- r( R/ @2 T- W  L
    根据附件1,定制一个量化的信贷风险;
    - M5 j* B' ^; O7 S" H( U为银行制定一个信贷策略$ b. @* ~6 R6 j: B4 e& T, n. a
    有突发状况是,上面两个问题应该怎么重新规划?& V' L! J3 b& i
    三个问题,我们分别称之为问题一、问题二、问题三。
    ( E2 p( u3 }& F# l& T3 Y7 Q# v. H! i9 }0 r% i
    # x1 G8 N0 T  ^7 v
    数据说明2 D7 W/ A2 @' A, l  @1 d: y" _
    附件1:sheet1:给出了企业的代号,企业有无违约的情况,信用等级
    5 m! G6 `) A& S2 F; c+ Nsheet2/3:给出了企业的大约 2 年的进/销 量的发票数据,4 [' q- D1 J! P" e3 r+ F7 P$ N; p- i9 o
    附件2:给出了企业的大约 2 年的进/销 量的发票数据。没有给是否违约、没有给信用等级% ^# }$ {( K, N1 m# Y3 H1 `; `
    附件3:给出了银行的利率,以及相应利率下,不同信用等级的企业,不愿意贷款的概率(原作是比率,我感觉能用比率近似概率)
    & h% f: c$ _9 F$ w  p
    2 D3 I1 X' Q. \5 z# E2 C5 b) ]0 B; l
    9 O. c* S  {4 a9 V* g/ }9 J0 C
    问题一求解7 C9 R: }. s4 F+ e2 j. \
    你们看,附件1 比 附件 2 多了什么?信用等级、以及有无违约记录。而问题二是要我们求附件二中的企业的信用风险的。所以,仔细一想,肯定是在暗示我们,1、用进/销 量数据,来评价企业的信贷风险。2、信贷风险的量化指标,需要建立在企业信用等级、是否违约两个变量上。3、设法建立进/销 量数据与信用等级、是否违约的关系。
    9 r) C. E# E) r( L6 v  F/ F
    ) @. B1 P" ?3 X$ A

    0 f( c  h6 C! e) ~& W, x, I好了,第一步咱们清楚了,就是要建立信贷风险与信用等级、是否违约的联系咯~
    , S  l  Y' Y4 H/ a. [' P' K7 w
    $ I: L, b2 x3 g2 P# b9 z: x
    ! G8 b7 i- ]8 S' S. S& T- \0 C% ?
    我查阅了一些文献,虽然说得都很复杂,但概括来说,就是一句话,我银行借钱给你,你还的起吗?这就是信贷风险了(说得比较通俗了,有点对不起学金融的同学们)
    ! X" A4 c2 y( m0 @8 `, X; n# J
    5 g( X2 Z5 J$ W6 }
    ; U; c& j6 W7 [7 m7 V+ E6 s
    于是,我将信贷风险定义为:企业违约(赖账不还)的概率。
    # t) y2 L: R& Z5 L8 {" D4 V' T' z8 G; W9 N. W' @3 B
    8 b. p; }# ], m- i
    而机器学习的知识告诉我们,分类模型除了能够自动判断个体的类别之外,还能够计算出个体,属于该类别的概率。于是,这不就是一个机器学习问题了吗?7 ?( O4 k1 g1 G

    9 H% Y4 f* K1 W

    6 R2 A7 M& |0 X  j这个问题就是:根据进/销 量数据,训练一个分类模型,然后将模型的输出,确切的说,概率输出,作为信贷风险,Over。+ H8 L% Z% d4 V7 c3 @$ V

    . [3 z" f+ l* }
    + N. ?3 o, h: q0 ]+ ?; I2 B
    但是,进/出 量数据是时序性的呀,如果按照上面的思路,那肯定是要一个企业作为一个样本个体。可是…,这个样本个体也太奇怪了吧,是一个时序数据,哇,都能构成一个表格了。。。  l7 J* S* `, e- N2 V
    / m" V  o4 g$ g- ?

    4 h) U5 h" G1 S9 a3 q按照上面的说法,这有点接近自然语言处理了,也就是一片文章,对应一个类别。这里是一张时序数据表,对应一个类别。天!麻烦!
    0 V( X/ e1 M( R, C* m% X+ ?- s6 M8 T: S& O6 ?. V% G3 r- K. \( J

    ) l! Q5 ^  m# {" X1 o. \5 e' j* a有些大佬可能已经豁然开朗,用 NLP 来解决啊!!!
    . F% o. W( O: w9 w/ R
    ( w, R3 C. E" r& W+ G3 m3 h
    ! `0 ^: W. y2 W* I
    否也,这种跨越对我来说,有如天堑(虽然我是搞 NLP 的)
    $ N6 D  H- W5 L" r0 x0 b+ }( S0 F# D8 o4 A0 B( x

    % n) S; n) ]. F4 `/ ]4 x因此,我决定,转换一下我们的数据集。
    7 @0 Y# w5 ?( G  t% q' V* Y  M/ l$ Q- E3 U
    ) V0 ]1 F, E7 \, o( K
    数据处理4 U+ i: ?( W  ^; t" t+ n/ H! n# A( H
    首先,如果按照上面的思路,用机器学习模型的输出,作为信贷风险。那么就要让数据变得简单一点。2 B. N# W! P- z8 K2 M

      u  V% {- @! z. [. ]( l9 f; a7 X# z

      c: S* m) ~7 F原始数据是这样的:多个企业,一个企业包含了大约 2 年的进/销数据,一个企业对应一个标签(是否违约)。& d, @7 J$ ~/ {  d; f1 c
    & i6 y& w; q0 V, H

    ( R, B9 o) f/ U' ?  Z2 ~$ |我们希望的数据是这样的:一个企业,对应一个向量(行列都行),并对应一个标签,这样才能用机器学习模型。
    , G& v5 q6 H/ T8 b1 V% q6 P6 }  m" S0 g- I! Y

    , S" o9 ~- ^2 ~# S9 O! T因此,必须将时序数据弄掉!!!" {: m! _  Z! I& h. u5 P' u

    - E2 |1 \6 w/ {7 H3 t

    5 w& V7 {+ S" t7 ?3 h由于数据是按天给出的,首先,为了简化,我们以 30 天为单位,将数据合并!& @, |6 s: E6 U% @( C# E+ o* [2 G

    2 V9 s) w! F" @+ f

    9 O# v2 b  s) g6 b# Y2 P然后,用一条曲线(我用的是 9 次多项式),拟合时序数据。有了曲线之后,我们不就可以用函数的系数,来替换原始数据了么?
    1 v3 M7 B1 b1 A, `" u& y" i! e
    8 `# U5 i$ o& |/ P& U6 y3 P8 F2 G
    $ q9 p4 M3 b9 E7 f, Y% ~+ e7 h
    这样,一个企业的数据,就从对对应表格(时序数据表),转换为对应函数的系数(向量)了。* r" \+ `* U. g, `' v- x

    8 q5 R0 u: K# O# l
    ( {# E" E, ?* }. Q
    等一等,误差怎么办?用曲线拟合数据,肯定有误差的嘛。/ x9 V$ M% n4 l6 K3 G

    0 K+ e- Z# W, G2 B
    3 \, K7 M, O! w6 Y# @/ o
    好,误差我们是用什么来度量的? 常用的有 R 方对吧。那就计算出 R 方,然后把 R 方也作为企业的数据之一,不就得了。0 w4 \1 t  q' S1 f5 @
    ; M/ o( B: q6 u% a

    : s5 I/ V; S% ~- y  q可能有人犹豫了,可以吗?
    + L/ j2 \4 z, q
    , l. h0 X% Z/ y) h, f% B- K

    2 o* r+ ]- z8 F: v* ~0 T好,拟合的曲线可以一定程度代表企业进/销的基本规律,没问题吧?( \  }6 D: Q' l; n1 s- C
    / }: ]- Q1 o  @

    : \& a" C# k0 n8 J/ p! @R 方计算了误差。换个角度想,可以代表企业的进/销,偏离拟合曲线的程度,对吧?7 [0 ~1 c5 h% m9 ]% A# Z. [$ H. S

    - T, V5 W6 f1 L, h
    ! @& d( @% m+ a
    这不就得了么?2 A  U6 Z' C; T7 @' \: r
    , ^9 S, H! F7 H/ S9 ?

    / d  U" m8 I" [3 h$ ~当然,误差是肯定会有的。但至少经过这样的计算,解决了我们的燃眉之急吧。为了方便讲解,我们将这个数据成为 一数据 吧。
    8 {! f' Z$ ^5 h' E5 G$ H- `2 h% N* U" m6 k9 J! q3 u3 S, V
    6 C: E& u& N! r" j2 s( l
    有人还会问,信用等级呢?我们不能忽视这个数据吧?da si ka ni。) _. D3 q6 J, g

    # W2 B3 B7 n' I( R; S

    ! @, j% j2 ]: |3 O1 x5 l且看我怎么处理,我们可以像 NLP 的 Word2Vec 那样。我们用一数据为输入、信用等级为输出,训练一个模型,然后用模型的参数,或者其他东西作为 二数据 不就得了么?8 E# a2 D: p  q$ Q, V

      G0 y1 Y7 S4 d; M0 `0 b: p

    . v! K# z- p1 R' K2 A- p之后再用 二数据 为输入,建立一个机器学习模型,用来计算企业是否违约的概率。 Case Close!
    ' h0 ?8 ^! g, U, @) _! @# x1 n" y: {! J3 d

    + Y2 ?1 [4 b: F问题二 求解4 ^5 i/ ^+ Q4 C* e
    制定银行信贷策略是吧?, b% i% j1 [4 X$ K! d

      ]3 w' q9 `. z4 F% e
    " S/ b- l! `( q$ b3 P# v
    怎么制定?无非是利率、期限、额度咯~
    ' ]2 }# @. z+ L/ @! I; }8 ], V  `! N4 r+ A; v! j) [$ z

    0 ~  `& H& I, o% ~7 Y0 g期限我们不管,因为没依据。利率和额度紧密相连,都是钱的问题嘛。
    - Y/ f% L" X, Y  Q5 {- f
    5 c. \1 s3 f) ?% V+ j8 m

    6 `* g9 C/ l/ @" K. w8 C让我们想象银行是为了干什么的。商业银行肯定是为了赚钱啊,哈哈哈哈。
      w5 }. @9 N6 }: R& B  j4 C! i+ g4 J( E

    ( }9 o1 c9 }# t" I于是,问题转换为,求解一个优化问题,即选择合适的利率、额度,使得银行的利润最高。
    ! [$ l# r# H( a" G% M: [2 \/ d  A( Y

    9 L9 D9 h1 u; q# J) p8 X8 eso easy?ok?
    : H  ]% i( Q; h4 |7 N2 }3 I) m, ^5 Q& N' S$ X2 o

    5 i( m& R5 }1 _; O于是,最根本的问题,就要对银行的利润建模咯~~
    # Q( M9 M+ |7 ~! N$ n8 W& _) L0 q6 X* O3 C7 o/ ^* q

    $ Q2 a4 L/ u. O0 u利润的期望 = (1+利率)^(时间) X(企业不违规的概率)X(企业愿意借钱的概率)
    . _1 ~% a# c3 K' H6 u! R( k/ {" p2 m
    . y. U0 p( X# k" V

    $ n' \% y) G0 G2 r用期望近似利润,case close,say goodbye。+ j5 i) b" [6 b9 p: E

    * P! @1 Q& G  X# f1 j$ N* X

    5 _5 o) [: G: W( G& E5 b8 _, U至于优化问题,加上题目约束后,就是一个约束优化问题了,怎么求解?方法实在太多了。我们训练机器学习模型,不就是求解一个优化问题吗?作为弄机器学习的,你不会连求解一个优化问题都不会吧?
    + O3 j  g9 j% P2 Q( D  p: W8 t8 _7 ~$ p5 f# R- |  ?

    # b, j& v! v8 b( o: j5 c! k有的人会再次反驳:可我们这次求的是一个约束优化问题啊!
    . _: O( m1 ]# k$ m
    % T- ], P1 B! r) s6 \0 k0 X

    8 z6 H( Q  t0 |1 K) ^我会答:你用罚函数的方法,不就可以将约束优化问题,转化为无约束优化问题了吗?) D/ t1 P2 ?! u5 n4 ]

      _9 z* ~# @$ V+ K( H  l

      d# [1 s% d* t8 x$ Q# r% b# ?; o问题三! t  @' a5 c. _- G, I1 v" k4 b
    突发状况会影响企业的运营状况,所以我们只要将 一数据 的 R 方微调一下,不就得了吗?????
    , M% v1 `0 j- p. x+ R7 h3 c. i
    , D7 ~) b2 z* Q- B
    & g3 W; f! ~  y& l& E! Y) t' y. E
    有点简答吧?
    7 C$ Y- J) D) D4 @  U4 C; J
    5 f& |: {' p( d9 K( {6 O  h

    ! \: }' _3 A! P8 l最终总结9 A! g+ X5 }8 P$ t
    C 题,似乎是最简单的。但处理数据,比较麻烦,可能很多人卡在这里的吧。最难的一个点就是:如何将一个时序表,对应到一个标签的问题了吧。4 H' n" Y6 t2 Z" m
    , J( y2 \% G) s7 D+ o4 N0 v; R

    - L$ G# m, V8 K; D: e( s: \. G好了,最后一次数学建模比赛了,大家江湖再见吧。
    1 V4 h8 p8 n+ {  W% T7 c9 b: \————————————————$ l  n0 p: ]$ ?/ O
    版权声明:本文为CSDN博主「zhuo木鸟」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    6 D- x6 [. f4 b4 ^5 g$ ^原文链接:https://blog.csdn.net/weixin_42141390/article/details/108580140  O4 K* u: C* K; c4 I) T+ C

    ! X, @% s) i2 Q' H  n1 C5 x. G

    风控大赛.jpg (209.44 KB, 下载次数: 0)

    售价: 1 点体力  [记录]  [购买]

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-14 20:38 , Processed in 0.417045 second(s), 55 queries .

    回顶部