- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564663 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174622
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
9 M0 D7 ]) m/ M) [
2 s0 G6 V' d7 S2 y p) P( F(1)写作缘由/ j0 K. m9 P4 _) x* B
(2)统计描述:
3 f" g" v1 c3 r: ~4 j追加用excel 做频率统计
! \3 n' |! H, J8 d(3)相关分析(点二列相关 )) x1 f: |, Z; U
(4)回归分析2 Z- g+ ]$ F h; O j
(5)特征选择和数据预处理
8 t8 a% F, C! ^. `(6)缺失值的填充
: d- I" x# F' A; B% L7 H(7)文档编辑的一些技巧& u8 B. w6 z5 i/ _
(8)团队合作的一些心得
! q2 A( O. Y5 \* s$ e' f(1)写作缘由
4 F7 u0 p! P1 s ^4 `+ R: ]6 ?# w l8 [$ O
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下$ t, \: I- o1 P# g* K# B0 m1 P# G
' y7 X, a0 z2 h: k0 Y! j(2)统计描述:* r; b& c3 p& X& ^& g3 G/ D
% ^4 h7 j9 a8 g1 V' o
① 频率统计
4 Q1 `4 D; S: q! n' ?% g② 中位数 ( B1 A3 v! d C' C3 |0 d
③ 众数 " F. O8 J6 X5 y, T
④ 平均数
7 Z, s! h, n9 \8 x! {% b T⑤ 方差
) K. z) n7 W( R8 P6 _/ L⑥ 标准差
6 [1 T+ ?0 Y% k' S3 L) H用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
p" o- B: E/ z5 Z9 y0 E3 h& A& J# w( }" L
追加用excel 做频率统计* m7 q! E4 O; `# l7 W
6 i8 j A" A/ L5 N* Y6 Lhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html6 G: t S1 u" ~" e3 O U- y
; @. ?8 Q8 D( s# N' ~, W( n
(3)相关分析(点二列相关 ) t, [# s" w u' @, \. P" u$ V+ m
. V4 j) y0 h0 L m' `, Y8 a$ l$ [7 s* ?
1 H- ?' m+ ^ f+ @. r" \
) @0 c2 @* z$ V7 @" P
5 V7 m- `6 z4 k8 k
1 u7 i1 O4 F* B8 _( ]. v(4)回归分析5 Z. L v+ X6 d
$ u- W. T, T* b6 S# {Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
' y5 b( x8 A# E
3 g$ ]$ ~4 Q$ U/ }' Y因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。! |- V* p% |. Y6 V! I: G& D
; ?4 n7 o( X7 T c$ x3 @1 {回归分析一般有这几个操作: : [4 ]$ P/ c* s8 q5 p, M V
① 设置筛选条件,刷选数据集 valid # l6 K3 v1 ^0 H \, P$ M# @
' y+ s D4 a% Z8 b& c2 @$ t0 ^( d0 W# h% o$ Y8 z
; r, R( _4 Q; q" u* D3 S9 d② 模型拟合度检验
- F# E; ?- ]! t# R5 t0 t( R9 Y1 E) S/ J2 L/ Q5 Y
9 ?6 _" o' A) H+ ]- `! f
+ y/ S- q, K. G; }9 b, ?③ 预测的模型参数
: O+ R, q2 _. N# ~, y0 [* Y3 A' _1 k% U* s4 L6 k
④ 预测结果,准确率. x+ Q& \2 X# {% s& h
# ?5 ]' v/ Z+ `, m- L
; L; H( u/ c( V+ [8 H5 e A- @3 v/ P) ?
+ Y( L8 I9 E' ~& r$ g, X(5)特征选择和数据预处理8 L1 W1 ?. `3 a& E) V3 f; W# O
) T8 }: o. F: s; @特征选择,主要是gzh的想法 ' c, z+ c8 t, f) q$ V2 @, ]
特征筛选的思路:
# H4 g! G) y# h) Q( X分类变量用1 2 3 4 离散值 % P. D2 Y* s; t1 ]* G& ^
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
* c7 _! r; u2 F0 x3 R对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值- ]' W5 l0 m7 d1 M! t( j. ^
: C& S4 q0 n0 z* }! c注意了: 1 d( e; H9 V) W
筛选特征的时候,重复性要考虑、缺失值要考虑' D9 S' d$ w7 |! y4 l" J" E; z
2 C3 k$ {2 i. A
(6)缺失值的填充
& Q7 e! [2 Z h }8 f0 N
4 m6 `1 w" c2 [& c J3 F7 l1 A2 ]0 S# m% I" }
* P$ W: X8 L/ }) H1 L' o(7)文档编辑的一些技巧
- |/ f. ~. W. q4 m/ {' a0 C/ ?! n
8 f+ `" k" n7 @" f% [) ihttps://blog.csdn.net/qq_26769591/article/details/80848841: x# W) B. Q% Y( W$ E
0 D+ ~) Y4 X8 t9 ^" n: H4 s5 d8 y
(8)团队合作的一些心得
& L7 @9 ^* |& Z9 f' w
* ?' g7 c# Z* p# }5 P2 b& M1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 1 a2 @+ P: X" J4 V# F+ D3 b; D
2.不会乱 不会重复做功 不会丢失工作 . c/ V7 l- G7 x! j+ n# c9 t$ r
3.经验丰富 总能拿出一种解决方案 9 N; \- m: {$ d5 {6 t& f
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 ; M1 ^% K8 b3 W- d
5.大致方向总是不差 错也只是参数不是思路 不是算法 ( T4 f4 J! W$ q$ E
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 0 F7 i4 P7 \3 N M/ C7 T% y8 C" ~( U; o
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
4 H6 C3 r5 p5 m- W z, g4 S---------------------
( o K% l# O/ H
6 C/ ]8 T$ d3 O/ ^
) ?& W1 U! _% G# j- m
% t1 M' _1 a0 j( Z: ` |
zan
|