- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563328 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174221
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结/ A! O% d) g4 ~1 I4 v) T4 j0 k
数学建模大作业中涉及到的知识点总结:
! l" L. z# E+ Z- N9 @, X+ R; w6 I* R' H' O' S* w1 N
(1)写作缘由# j: R2 e- V" r0 \8 s& f: {- Y
(2)统计描述:
: @% k6 Y3 s: H* y- r I追加用excel 做频率统计3 S) O% K3 f1 D9 z
(3)相关分析(点二列相关 )5 Y8 Z' B3 A- L* L8 ^
(4)回归分析
+ \$ E! o# A2 v) e ~# i, @# ^(5)特征选择和数据预处理/ n" Z! y& A5 A I" v8 c+ S
(6)缺失值的填充
, N0 M x2 g8 d7 N(7)文档编辑的一些技巧
$ K. g! ^+ w- c(8)团队合作的一些心得, y' j/ }8 z' [; ^1 ]
(1)写作缘由0 P6 }0 `% f) i2 _
/ U* L: L+ C4 P& S$ w: k
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
# F% A3 Q, s$ W5 w: P' F3 K9 {
& v. p$ Z, B& M a+ J(2)统计描述:
3 ?2 I+ `! X& c5 R5 Y9 D
( J1 z! B" b. Y3 ]6 w① 频率统计
8 N8 w: a# s8 ]2 ^/ ~* t② 中位数
3 k6 @: |, T- H2 W& ]6 X5 \4 }③ 众数
2 x U2 z; c& p8 H( u& c6 r④ 平均数
; t: k$ q- o2 `6 }⑤ 方差
* {8 w/ Q0 R' U+ D! F* u0 t⑥ 标准差
% _; Y1 j! v( e% R2 e用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
& L& D( `4 _/ A0 k% j b9 V, P1 L! M
) p9 ~, q' S6 [2 I0 X
追加用excel 做频率统计
# x* B# I; M8 [1 Q. L* C5 |% t( p![]()
/ C3 t6 ?% |& H- U( ehttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html/ A" s, w; Z+ k
7 X! M* t1 ?! o% J
(3)相关分析(点二列相关 )
7 L7 O4 b3 F# n1 X# P- S![]()
$ a' b R3 R: r' \# g7 r$ U2 O: t# w* F8 x$ j' M2 A
![]()
7 M5 N* I: s- G7 @1 x" ?, G" z% k% K; C1 Q
% O, t# v% S: A
(4)回归分析3 J3 W. I" ?/ |2 }* `8 U# H
/ m! _8 p$ {) _: Y, {/ h- i
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。* P* P( d* `6 D1 i. [, a
) h% e. W! u. M
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。: P4 j$ m* z8 ~
4 ^6 f8 N0 L, `; ?6 a _回归分析一般有这几个操作: . R& i) A/ o' `. S. i2 d$ Z1 K. `9 I
① 设置筛选条件,刷选数据集 valid 0 \1 w5 q' ]# u4 |! G
1 {8 r# L6 O7 ~& p9 c$ G
5 a0 C/ i4 s- Q3 \ $ R. A) G3 k3 T( B5 S3 A0 g d$ n
② 模型拟合度检验 ( h" q% ~2 @4 o
5 p h: E& R5 Y+ K: F0 A& m& D
0 R7 m- m) ?& F" x
' l; M9 F9 O' C( }* E. A
③ 预测的模型参数
4 c. z, [/ Z+ q, c ' b9 v: p. g8 K- E3 |# I8 v
④ 预测结果,准确率
( \ X. s, d/ j3 `4 f ; I: z/ z2 s% D7 T* O
$ g( ~" Z Y3 G( \$ \+ ~
9 ]( r1 c9 @' s
8 y6 `3 f) Z6 q$ v/ j
(5)特征选择和数据预处理4 X/ O9 t4 L# K& ^/ }! R# W. `* j
" |7 O s7 p/ H( ~1 { T5 L
特征选择,主要是gzh的想法 ; C, E' J3 {0 \9 Z" r; w. j* |
特征筛选的思路:
]5 E Q! u/ W! A8 W+ Y分类变量用1 2 3 4 离散值 9 M5 R# z* W( p+ R1 _6 @ G, g
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 9 H$ u: s1 d1 }8 l* A" ~' m
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值! s! J+ V3 D+ q2 d
0 Y/ P# j9 k, E% j注意了:
. o$ @# g3 A1 j3 a( }筛选特征的时候,重复性要考虑、缺失值要考虑
" R- O0 W; J. ~1 A# a" J; K4 b7 }/ `/ h, J. P3 ?
(6)缺失值的填充! W' @# g; O; O( |/ L9 |
+ R% X. t7 u2 x: c: H![]()
9 |: S3 ?9 A! b- E' h z9 |+ D
! R$ x3 s# b. S2 \8 f(7)文档编辑的一些技巧( r: y/ i" U1 q. C
* m: ~" g3 C% I9 i. u% g+ Ihttps://blog.csdn.net/qq_26769591/article/details/808488413 F, |" X$ i [0 V+ I
. F4 q8 }2 D$ ]2 A$ C9 G3 |
(8)团队合作的一些心得
" S/ p9 Y# B, C5 d# m1 R- f5 Z/ ~. d; w/ s5 p. @: A2 N' U
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
9 D3 C& F. E" c$ t9 A2.不会乱 不会重复做功 不会丢失工作
/ b- N/ K- v: h2 g S8 U7 a* D h0 h3.经验丰富 总能拿出一种解决方案 ( r; k6 O+ v+ Z4 ?
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
5 h" v1 l. ?, g. d2 P, y' j( f5.大致方向总是不差 错也只是参数不是思路 不是算法 # S' ^/ Z" K% \) E
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
( `" A% L5 g e' w) a) H8 p5 ~+ S7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
# P1 F+ K' n$ ]---------------------
9 F- U' M* g- ?) R作者:-英击长空- 0 l( [0 q; `9 ?, Y( I6 e
来源:CSDN 8 @$ h% f* U$ t7 \1 I- H( t/ G1 }9 I
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
- U# O& z9 s% L9 W1 H/ V; B) d6 `1 D( R
) I( J# C# Q, o
6 n6 T. n$ `& [4 @" B
) u- ?3 i1 B1 \0 Y( t3 E |
zan
|