- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563305 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174214
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: - N; w- L$ {2 V" h# v! e; y
" s( ^; A4 B: Y1 v* t7 ]
(1)写作缘由
( K9 {- }# k& ]; l( K) w3 k(2)统计描述:
2 X& c1 f( @" [追加用excel 做频率统计9 ~5 f" Z! c3 G
(3)相关分析(点二列相关 )
; d, L8 @' j" ~: n( ]9 r( ](4)回归分析9 \# U* A4 ? Q; z3 {& S
(5)特征选择和数据预处理4 l& a- M' Y) T# M8 ]
(6)缺失值的填充) M! Q7 x. K l% o7 I( J q
(7)文档编辑的一些技巧( ^3 w) U" y4 e, A! G4 b
(8)团队合作的一些心得( x! [; T; C! _ T, @
(1)写作缘由
% t b2 m& _: P- K U
. f# Y1 T6 \; Z. f, D9 q) Z6 g在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
+ J' I! K/ n+ ^! i( M" T w6 G: S: p) e3 D% X; Z& D2 j) h9 I
(2)统计描述:
: q1 Z: o7 L: o- k) G) s' K, m4 e
① 频率统计
1 j7 @& V. F( \, q: j8 A, D② 中位数 0 N4 l( O! o, m% X. B
③ 众数
/ H y- s* ~8 N0 t. y d" E( t④ 平均数 0 t$ l; N. l1 w: ~7 q
⑤ 方差 ( h5 S7 X h/ }2 A( v! \ r& @
⑥ 标准差
3 F0 E0 i8 b: y% e' P( t6 y1 d- y用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 $ @6 g. i: j' Q6 F0 ~
- Z9 t$ G2 E, X. m5 z/ a
追加用excel 做频率统计! P+ K- V) g: r9 o7 H
. L9 [" t c) H9 V1 i& D1 J
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html' @- t! `5 U2 I
' M$ T7 k0 C+ |
(3)相关分析(点二列相关 )/ p3 h( a* [ {, `( n
! |5 D% A2 C$ a- x+ {
' d8 Y1 v. m& [" v1 j
8 C8 M* {% }* ? j5 `3 |& y. s, _+ c% O& G4 ?
7 e, z8 B% d4 s0 v0 q4 [1 r/ r(4)回归分析4 y4 a( ]% ^0 N' r. U) g: V
+ s5 b$ c# ]" I% P
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。7 S) s: r2 q) K- U# r! `
+ d3 U7 _' a, a5 {因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。8 o$ w* o9 S' X; R' I3 e! {2 Q& Z
+ b* r- @9 |7 ^/ Q& j( S
回归分析一般有这几个操作:
/ t5 B6 B: M% `( j1 `6 x; m5 o① 设置筛选条件,刷选数据集 valid
6 U* I' G6 k0 _; w
j5 F- q" ^8 L8 K$ C+ v4 N6 n7 n. v; L' t
3 @' M3 F6 a% W* b② 模型拟合度检验 & ], x: }& N2 V+ |1 K3 F0 c
; ~9 D9 f5 ^: b# r" W' b
3 t5 M/ T7 y( |- @) ^9 @* V/ k, @
/ l* s/ d" r8 U7 J: E, d. }9 m③ 预测的模型参数
3 _+ N8 G/ ]* C; d+ _! C
8 {% Q% m. g; \5 ^, v9 a④ 预测结果,准确率
! ~' E) F. j; g* N$ ]/ I9 @! l5 c2 y/ b* Y" ?/ n/ {/ f m, U1 s
: T8 x& f; W8 D
2 r, |* M, R ]: O+ Y7 l* O* n; C" x8 Y: A- N0 F$ _, j) i* s
(5)特征选择和数据预处理
' Z1 z; S. l; N N! i0 A/ ]' P$ ]4 I3 I
特征选择,主要是gzh的想法 6 v. B% O% u; M: H
特征筛选的思路:
$ [. ]. D) ?" S* s3 h+ Q' b分类变量用1 2 3 4 离散值
& Y1 `2 k" C1 U- B7 L) I% a对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 / r P2 t! P8 z+ V- C. w+ d
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值5 V% F& ^- F& F6 v# ]6 r
- `3 w% Y8 x$ d, g$ `
注意了:
5 B% t. O9 m. o8 c筛选特征的时候,重复性要考虑、缺失值要考虑
# y- J5 N) D4 g9 [0 U$ |4 A v$ z d# c, U) ~! W) R1 g: \4 V6 }1 T! |
(6)缺失值的填充' |( e, L% R2 Z
" Y2 k1 P' h1 z
3 j) ~ D$ f% i: }
! o0 j$ c- e- c
(7)文档编辑的一些技巧# N, V# X6 O; K4 J) J; k n" r
k5 i1 a6 Z8 y
https://blog.csdn.net/qq_26769591/article/details/80848841
2 }& h8 W7 h* G, Y! ~/ ~: ]" k% r" o O. e/ x" n8 M& Z# ~
(8)团队合作的一些心得
* X4 l `/ m" O& x% V4 C2 Q& |7 y- Z! T: v
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 6 q0 t: l7 Y. H4 [% Y
2.不会乱 不会重复做功 不会丢失工作 & E9 S# X; X5 a) R E% Y& |
3.经验丰富 总能拿出一种解决方案
/ ~( B0 [4 |' W* I5 X) M K4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 , y* i- f" V" P9 x2 \3 M
5.大致方向总是不差 错也只是参数不是思路 不是算法
( m+ S# k, w& I* I) Y8 _2 S6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' U* S7 }5 B/ Y: r; m% @2 e( y
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线+ I' r1 X+ S. R! v
---------------------
: O8 }1 s5 w* m( `
8 P- E" x7 W: W$ x; C9 a% R
1 q7 O( j5 e# Y5 ]+ r' a5 N+ D- v0 w/ W4 f- H+ ^( Q
|
zan
|