- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563312 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174216
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结5 ]5 {, c: Z. k9 o6 N. r& N; t
数学建模大作业中涉及到的知识点总结:
9 c: m! g, q0 `# Z6 c7 S$ V- o# U7 P/ j F4 ^& R3 U
(1)写作缘由. [& T- `$ y. z8 x2 _3 l4 H& _0 m5 g
(2)统计描述:7 H! f: t8 K% {# i* I, ^4 Q
追加用excel 做频率统计0 H: O A! _- K S3 l
(3)相关分析(点二列相关 )6 o1 U$ e1 W9 I# z2 Z7 @% p8 u
(4)回归分析
! _: w6 F- k' l# ?, s(5)特征选择和数据预处理- c. j. S7 E8 R' Y/ C1 H
(6)缺失值的填充. y5 L8 r7 m( `. P Y
(7)文档编辑的一些技巧. a/ l4 \: o( m: D+ B/ Q0 n% `
(8)团队合作的一些心得
$ k* | }* l* T9 x8 L(1)写作缘由
% z H6 }/ i7 o% Q4 J7 i2 {; j" j9 ^: |8 v
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
- f/ x$ k3 G+ G7 j$ Z
P* s& u* E+ P(2)统计描述:
) e$ ~6 q) K2 C& v1 d7 r
' G5 Y* d9 {! v: e' N5 B. J① 频率统计 0 P @! j6 o' G
② 中位数
6 I- f4 `: [. W! u- z; F: m9 F③ 众数
3 B8 X. K1 K- b" D& r④ 平均数
' u1 Y A" S: B1 }5 f⑤ 方差 o; L4 J4 f) c/ v# q; Q" Y
⑥ 标准差 + M9 r: s9 H) t* s# W
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 t, |+ W& v p; d( q' |
) Q7 D4 s) j2 ~5 y
n0 e6 l1 P* E: @! {9 Z4 ^
追加用excel 做频率统计0 h4 h: R' i: j! s* }$ i$ S
* ^/ I+ \4 C+ P3 M0 M2 E' G6 _
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
0 K. }2 s6 e6 @5 Y$ L
$ L8 j$ g! [9 ]% ^1 M# l4 U(3)相关分析(点二列相关 )+ F" o1 D7 H" L ^" V5 J( k8 O
& R! j4 y( Z4 q" p; }' J
2 A* Y4 N. k8 t+ M' x
! A3 _/ k# s. h1 Z* K4 v+ E) y
* @6 S! a* i- d* F- g
, x8 I3 p! L# M& L1 S
(4)回归分析
/ L/ `( F' u4 G+ I1 g( j) w. t# w; e# V" Y0 n$ I. w9 Z
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ L) g' t% Y* y: i; S8 B
& g- j9 ^+ ?4 ~4 h& ?4 _
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
! y5 o3 I! l% w8 ?" e+ c: S% }+ a) A0 r: j5 e, D
回归分析一般有这几个操作: ( M1 D: ~" B) p# V% y' P
① 设置筛选条件,刷选数据集 valid / U% c5 y; f+ m3 R- n% W
![]()
+ d) o. L8 f: b9 ^4 w5 U: [$ K: f. E) W( _
![]()
5 T7 G8 W; D# j" E② 模型拟合度检验
% {% ~, I4 K0 [* ]7 U, f ( c2 j- `! {! C2 P& ^
" N9 a! y( I! g; @3 X& \+ L( y2 ^
" @4 Y$ F4 t& U6 b2 x5 o
③ 预测的模型参数 * q; d1 d5 [! W( H$ @
1 @0 q6 ]; H# V; }( p
④ 预测结果,准确率* d8 E& n1 E0 y X/ j x8 i1 k; U* V3 a
! T$ e8 H, u0 x" ^) J( }: Z
S1 ^" L! @+ B+ o
& \# ^- ~$ O1 i/ D6 ]
: X, f- u$ U, n(5)特征选择和数据预处理
5 K5 L# z5 D5 \3 V3 U4 H
+ [2 P1 R- ]" B$ q特征选择,主要是gzh的想法
, q \* o) l' B- H* w% b1 [1 }. A特征筛选的思路: % y( Q( u( \8 I7 Q+ F* Z0 |
分类变量用1 2 3 4 离散值
; R, E& K3 P( _( Z X对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
2 T, ^! s* i! c2 j; d; h. L对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
) O d1 Z- P% y) a4 n9 m0 W9 T1 ~+ U- O$ w8 V `' U% ]0 o) A* d
注意了:
' H% `0 [' p2 I+ L: B9 ~筛选特征的时候,重复性要考虑、缺失值要考虑
4 ?5 n: V9 y. Q' {5 ^2 F# ?
* L q; c* I B: ^) _: N(6)缺失值的填充
9 g5 n/ l/ r! y" z, m% n% Q# U: c
![]()
K, j D0 F( p. F: p* T F8 v. R$ `* f b
(7)文档编辑的一些技巧
+ @, z) ^( j7 j8 Y- Z
- l L6 }9 O0 H* W% T$ d+ o0 uhttps://blog.csdn.net/qq_26769591/article/details/80848841
9 w' C* X1 w* d7 P0 ?: O& D; E4 @1 Z1 k$ B, t$ B1 q' m. T
(8)团队合作的一些心得0 E7 N, p+ s) Y8 A" o
9 a, Z+ c! B5 U0 u
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
$ @/ g! n9 U7 b5 V+ {) _" f2.不会乱 不会重复做功 不会丢失工作 0 O! A/ r6 b2 O! ~3 C
3.经验丰富 总能拿出一种解决方案
: n z2 R0 s, h; P9 x. g4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
: E8 b" D" ~, R4 y$ \+ f5.大致方向总是不差 错也只是参数不是思路 不是算法 4 d6 f! F2 z* M" Z3 q7 A0 p! W- r
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 # A! ~* U1 [8 a6 _* x
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线' h' W) L- b8 s! z) c) B5 i% C. Q
---------------------
e2 @' f" d& [. L6 e/ W# `作者:-英击长空-
* L% L+ N* B! @9 r/ [3 I来源:CSDN ) x9 O4 ]! i# ?+ j9 ]2 S& `
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
! L( [9 x+ i8 p+ X7 r6 N" E. b, }5 Y( a- h2 y0 R, ^( J
! {0 c6 [) e( \8 N8 g% c$ }) } F- o4 i3 R
- X8 C1 ~3 m; A' V: k
|
zan
|