- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 557172 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172524
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结) j& l- ^5 u( d9 y
数学建模大作业中涉及到的知识点总结:
9 Y% z: M9 ]% n8 g2 }7 j- a" O7 J' G
, V+ x- J' y3 f4 Y* ^8 c(1)写作缘由. @ Z9 q! v; P3 B
(2)统计描述:% X i, i! b( I4 f: Z/ K4 X1 Z% a
追加用excel 做频率统计% F3 E1 w8 [1 w' ]+ t- c
(3)相关分析(点二列相关 )
, i1 k9 T6 ~9 J. ]! _(4)回归分析
% Z8 a' N2 f) L* E+ p# l! T- u(5)特征选择和数据预处理
! ^$ N6 V* d) y; Q2 I, ]* O(6)缺失值的填充
( u% N" B2 K' v; H" H1 ]8 i(7)文档编辑的一些技巧
4 a8 P9 M, V k4 v c9 A7 [3 I(8)团队合作的一些心得* s* ]" E# G b+ S$ U
(1)写作缘由 h3 S" G4 ]: D; h) @1 O1 R' R R5 {
{3 x2 ^0 V- v- i+ T [7 a在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下1 w7 Q+ h3 I! D6 g0 I
/ b: h9 H* f \7 @/ X(2)统计描述:" o! C% I6 e+ ]6 `+ h
7 v p! ^" n, l z6 V# h
① 频率统计 % D2 `. ?& P& n9 t8 V8 M
② 中位数 ( M. S6 \* G2 A3 [, N
③ 众数
8 j; n$ F8 k. {% l( k7 k④ 平均数 & ~" s5 D+ I% d" j5 L
⑤ 方差
( P4 T/ b! c' O0 i! ~8 Y; c, A# V⑥ 标准差 + {% [" P& W! J: |, K
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 7 O0 m" F4 p* j- G( ?/ k/ @
$ U4 L, I( y5 O& b6 G
0 z1 D1 a- t, r+ G n
追加用excel 做频率统计1 b& ?: b& x5 p3 M
+ l$ I9 w \( {% b
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
, d* [% g4 l- a, h
, M/ C \+ A9 V. Y' X/ G5 G(3)相关分析(点二列相关 ); H O/ |1 y4 A9 F
![]()
$ y4 y- H: r/ H+ Z5 o4 o9 H. e' w9 Y8 U; a% d9 R
![]()
% O' v- T, m- u' Z1 @9 d. A2 _. T' M5 s; o+ j5 S2 Z* ^2 |
8 ? H4 g9 y+ v' c/ v
(4)回归分析
8 r7 Q& d3 Z1 i% b2 e1 \7 M5 @' o4 C. w4 a. l* a
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
% h6 Z, w- l! e! s0 G
0 j6 X8 a: D& |因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。6 h: b) x. }$ b) x6 L" ^
3 d4 x. \. G, Q. z) c( P8 ~
回归分析一般有这几个操作:
- v: J) _2 }; a- {4 M① 设置筛选条件,刷选数据集 valid ( J7 @7 Z" J; o% |8 O$ f
![]()
# u& O$ N. p8 F9 _9 K% X3 ~: Y* A8 C0 m
' V9 G' \9 i5 g5 y4 j! r( O# O
② 模型拟合度检验 - v' u" p! W- O0 ]4 L4 s8 }
![]()
$ O! M9 j7 y* \1 l) S+ P3 J # \6 e) g+ I. S# o" M Q: t$ S
# o8 t6 L! C$ p" d7 P
③ 预测的模型参数
! p( V, `. ]2 k; z - d0 ^' G. ~& e/ H/ L* t1 Y$ N
④ 预测结果,准确率4 n% Y* f7 m! _
![]()
6 ]3 h& z9 C+ c! z* ~. ]' v . D: O6 d& Z, l+ b w( w" Q
0 z) u0 U- @1 }4 q
" J% M$ s) X8 P(5)特征选择和数据预处理
|9 o) T" ]& k/ v; J- O" t* k
3 x1 ]% I. c% ]0 ^3 c特征选择,主要是gzh的想法
# I8 h" @" V" ~: G* b: D特征筛选的思路:
+ y5 t) l4 E* i2 ~3 q( m9 n分类变量用1 2 3 4 离散值 0 e/ j8 x" o H; `2 {
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 - V6 G1 s* G9 p8 Y
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
8 h- y2 z3 V; I" g1 D. `# v; v; Y* m: A; W- |. N! b: a c
注意了:
0 w1 \( r6 |( I" l, O& x+ T) e" ?4 S筛选特征的时候,重复性要考虑、缺失值要考虑
) L; a V: `0 W. L: H, w: b. I) J+ {, z( y6 b. d% C( A
(6)缺失值的填充- x. w( {( w4 N( S
" Q. y' e; h+ a0 V2 _![]()
9 b D- E; R, z% k0 _
" i5 d- X) G7 k; f+ r6 e, h(7)文档编辑的一些技巧/ X7 [) t7 d$ X% N
/ P5 |* B2 {% x7 `+ fhttps://blog.csdn.net/qq_26769591/article/details/808488415 L% z& V* {! f- |( Q
2 p$ |6 H: `. G, z0 d% _ r% o
(8)团队合作的一些心得8 ?3 X/ u! w$ n) f; {
1 V; u% [2 H$ S6 `0 c1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
7 }5 @/ S% n. N! l2.不会乱 不会重复做功 不会丢失工作 " Q9 Y# q; L! g2 O& g# I* g
3.经验丰富 总能拿出一种解决方案 3 g/ t+ o& P2 B3 H, g
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
" @! O" h: b' ~9 F% R5.大致方向总是不差 错也只是参数不是思路 不是算法 ' p6 J( V1 W# o. ?2 G" C2 ?3 g6 u
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 5 d* f. h5 s+ o8 N3 ^
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线( d o% u, E; [" q1 ^/ t8 _
---------------------
4 E" u& X A3 k* @6 G8 R" |作者:-英击长空-
9 d% o( s$ {. q" q7 c来源:CSDN 5 m! p/ ?* z: @) t4 X- z
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
' Y: q3 h0 e+ y3 C$ |0 w$ M+ l" F- C; O5 S2 p6 B5 |
+ o8 v& d4 S: M
s" h+ `$ J( I
) l- i3 ?, s$ }( N4 F |
zan
|