- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563327 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174221
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
! q; {9 \! f0 `- l8 U( Y1 D4 g( X' |# ]' _3 \' R# D
(1)写作缘由7 d+ R* S9 e) l# @8 k
(2)统计描述:* e7 Q" I8 _+ [7 g; o/ Z) z
追加用excel 做频率统计; h) ]3 Z* ?' {% o) p* P: s& m
(3)相关分析(点二列相关 )
' A) v! Q2 y* z) o6 D7 Q(4)回归分析) }' q; t) j# c( m: Z+ G5 `
(5)特征选择和数据预处理; n- S: f3 i8 B& L- T" ~0 o' D
(6)缺失值的填充 W5 d& q) y/ P; l9 {
(7)文档编辑的一些技巧
$ j3 r8 J. c* C6 s# f! }1 S(8)团队合作的一些心得
7 p J4 c1 w. V: q1 I5 h(1)写作缘由/ U+ R1 y4 m. ~: b) n+ c5 N
* y( ~* Q6 [! A p7 ?/ m在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下9 Z% i/ z b2 h3 v6 X; s
6 \6 }5 F5 ]+ e7 ?& m" n- I
(2)统计描述:+ k% V2 h- i v; ]4 e
7 T7 w4 Q, }0 p4 o; `3 i
① 频率统计
' c% N% w# S) k! J4 \② 中位数
/ j7 p" M2 c1 e; m9 E# e③ 众数 0 }6 ?* u0 ~, ~
④ 平均数 ' P, N* `$ _( a- ` X. ~- d
⑤ 方差 2 _" g2 X# B) H3 h a8 y, R4 A8 s, x
⑥ 标准差 ; z' C2 y3 Z9 w: [' K, D: ^+ e( x
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 7 |5 t6 N$ e N5 Y
- q, ^; r( z2 w" i* w( T2 x- _
追加用excel 做频率统计
/ e3 M7 ?" M) f! v0 ?6 g7 h5 ?: C) A* O: i
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
1 Q& \* V1 h0 v( [
) |9 [# g$ _1 j(3)相关分析(点二列相关 )
2 {- `% M1 m. l4 |; C* k, W6 t# @5 \, Z
9 b5 e8 K8 q, c' e. y W" _# W
, I: q& I& v+ a
1 F$ ~: W) t1 w; A
1 H! ?3 q! R) G5 E$ @(4)回归分析
$ [6 ?2 o1 k. T% n' q; V: Q3 I; h
, s/ c/ f0 ^- _- iLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ E3 n0 d) W0 a- b1 E6 p
8 i6 I: S7 d& v; F/ V: [+ B! y因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
! s) t( ^; }# J3 Y2 }6 q+ j/ [6 l; B0 B0 o! w2 V& O% N
回归分析一般有这几个操作:
: ?) ?& ^$ |: X: e6 F① 设置筛选条件,刷选数据集 valid * ~- o$ d" z6 B) ?4 U& }
" d1 A; y2 f! j# V n* W3 H# {
- D2 D. l0 {7 X: p0 \
% N- r0 e/ g% F, u0 k9 R: D
② 模型拟合度检验 # l# L$ o+ p8 F7 t% }. s8 ^9 U% d
& ^" ]' R- Q- k( |, M, o, M5 s$ ?+ B8 {. b
2 K% o, |) Q2 ?# n5 {+ N
③ 预测的模型参数
* F! a. ]# b( @0 R/ ~7 U* O+ o, r% l$ {* I
④ 预测结果,准确率
+ k1 X/ X r( l/ @& M9 C; G8 d; ]! |- m. D) \4 ]% s1 _1 c
" ?" k* m: V: h0 r- z7 @0 o$ b/ e7 S( c& v. X$ D2 Z
, C' E5 n5 N# t* V
(5)特征选择和数据预处理3 ^* u7 x# F+ ^# h: ]
! o' \& N& _8 G
特征选择,主要是gzh的想法
/ h+ M2 A, M8 O R! L特征筛选的思路: ) A& x8 Y B7 B2 l; j2 ]9 d
分类变量用1 2 3 4 离散值
2 X, V# ~5 Y6 {5 ?+ t7 U7 [对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
x- T3 |0 [# K3 ^* O对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
# P m% X' r6 j ^. J5 o" K. q+ b! R' E5 U2 l! {
注意了:
3 A0 V4 d, }* H筛选特征的时候,重复性要考虑、缺失值要考虑+ N2 T7 R- g' o7 h. `- X' |) J
- a9 @( |5 L" V7 G- p(6)缺失值的填充
* b# ~! @* e% T! W$ {$ ?1 _+ C+ _" F/ N3 {
5 p* o# V, D0 R. N- Y# w6 Y
$ t9 [5 `" E0 z9 O2 D, m% V1 [
(7)文档编辑的一些技巧
6 j1 H$ E1 u; L W7 E; |7 R$ U
+ N, ^; ^0 x) v* g, bhttps://blog.csdn.net/qq_26769591/article/details/80848841# L) j8 I- W# O K% @; `4 u
9 P! q5 K- s' B7 Y6 N& A" P
(8)团队合作的一些心得
- b4 d) c# b5 o( ~1 z! Y p4 V s) [
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
+ S) N) j1 v8 V, w8 I" r2.不会乱 不会重复做功 不会丢失工作 6 D+ J) \0 F1 G- i
3.经验丰富 总能拿出一种解决方案 / [( J, R/ O$ K# d/ Z) d
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
' T& t: y8 m# i/ K- }: F2 J5.大致方向总是不差 错也只是参数不是思路 不是算法
- f) W6 A7 Y! X" x1 |2 ]) g2 t x- ^6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 0 s4 H A8 v7 Z* h" N6 q. n4 l5 V
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
6 b7 S0 R5 c* r8 ]---------------------
1 d' p9 E; |) N' K. w4 Z5 K/ |/ m
1 `/ ^4 v% n3 g0 D$ I) H' S1 G4 g$ S: i4 b0 i0 I9 Q& }
* [) _1 F6 h; S
|
zan
|