- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563302 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174213
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: ) h, P: i6 e$ y) |& f2 M5 _
0 V s7 e% M& I/ w(1)写作缘由5 x; m- N+ [& q0 P/ Y
(2)统计描述:
: S+ U& i; z: ?3 v& | N2 b追加用excel 做频率统计; r* Q: x% G4 I$ m7 k2 ]" e! v
(3)相关分析(点二列相关 )
7 f7 A! ^% A! u. [5 Y4 m(4)回归分析
/ v- r; w% X$ E(5)特征选择和数据预处理
G0 U. j4 f6 U+ r$ A(6)缺失值的填充7 |% \8 ^! |3 S! S" B) ^: b6 p! {
(7)文档编辑的一些技巧* Q/ [! R) s1 ~' `2 v3 p! w
(8)团队合作的一些心得8 h: f( L9 c/ f1 }
(1)写作缘由
' [: Y% L0 L, Y! |/ \0 q' _2 Z% a) m* E x8 s7 Q
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
0 x2 t3 {0 G# t$ ^- h2 w
7 H" i- I5 ?/ a& g q" ~(2)统计描述:
4 i1 h# R4 C/ D" T" w, }9 j0 J0 Q6 j+ }6 m0 Y+ D
① 频率统计
' W& w$ Z* [" s. o) G9 m+ N% s: `; e② 中位数 5 }; S/ v# r$ i. e) C: g4 c
③ 众数 . J4 R! }5 y% b* ^! d
④ 平均数
9 R: |; d8 k0 l2 ?- E⑤ 方差
+ h/ Y. b( o, P0 y+ e* p o0 @& O⑥ 标准差
# K, V4 E; _6 i7 t) X6 s5 k' `用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 f" ]9 L' z9 K% W
1 E1 M7 Y( A, d6 O6 Z$ g8 K% ?- v追加用excel 做频率统计
2 [6 @0 i1 N' _( s; A7 ^; b% ?! Y8 h% F7 O5 g2 \
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
4 }2 I. f" }. i1 `
% |3 k3 v! _9 `2 X1 m(3)相关分析(点二列相关 )
* P2 r; Y" X2 [" l% l: b" `/ c! W% S9 r
6 y. u& q- {% g& `3 P) D2 Q+ j+ V: r! z
/ y, X; l# ~0 O0 r/ R* ?
# x: B9 A( I& S" {$ L7 G(4)回归分析 O' t$ B* e, {& M
0 A3 B- R; G o- d2 P5 K0 BLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。$ x |5 K2 i K1 w, }5 ?
0 x* v/ [% `4 g; n因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
- @0 y+ ~4 H9 y" \- |, n( I. [0 I1 g7 F% Z' J, s) j! _
回归分析一般有这几个操作: : Z8 N0 R$ |$ r
① 设置筛选条件,刷选数据集 valid
J. Z8 y6 J0 o8 u E0 P1 y. O0 G) M, O8 d! u! d. W
. g1 }% `" O# z4 u6 H F# }3 w
, D4 M, @3 P3 k0 _' r② 模型拟合度检验
( E; l8 s* V$ V2 [6 e* f; U% X0 l2 h- P5 U y% }, p5 X
; [+ P6 N7 [+ x( _! p G
- U: s9 Q- w# v) M* T% G6 A8 q③ 预测的模型参数
0 s. \6 g- @6 G8 _
" O7 j$ l! Q2 J7 B) P7 `) S. A④ 预测结果,准确率
, X3 \ _5 p7 ~: Q/ R. Q9 s5 Z( U2 c. Z
3 n, v; Y6 K/ Y. `+ ?) B
9 f! ^! A) P! m
; X# R! C8 u1 M4 [; G(5)特征选择和数据预处理
/ |. m7 _( o1 v* r5 Q9 f5 \% _
5 F: b3 q4 w! n' [/ |特征选择,主要是gzh的想法 ) y4 O, ?* L: J g4 K2 y7 R
特征筛选的思路: 1 `0 w- z2 x$ F3 I* M6 a, q% t C7 J. T
分类变量用1 2 3 4 离散值
( X3 a% }% C0 q对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
" D# [: M% f" i7 I8 O& N对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
/ |1 e/ e0 {5 Q! W- U* e# z1 u% C4 S: s
注意了: & f3 |. k @ l5 ^# h$ N9 [0 j1 a
筛选特征的时候,重复性要考虑、缺失值要考虑
9 V8 h4 C/ k# i$ S2 ~' i2 [1 J
9 E% ^& j3 _( S4 F7 u(6)缺失值的填充% Q) R& a$ r# P1 `) u. j
& v- S/ o; n8 c' {; x: \/ m8 ?* d$ C4 ?9 c6 l& e+ o& x
$ V( A/ M! \3 g/ k4 g3 W- m# ~(7)文档编辑的一些技巧" \0 ~* q! J; K1 I# g4 l
& r# ^% R# g+ ]) Y+ m- D
https://blog.csdn.net/qq_26769591/article/details/80848841/ K& R' N* ]( R* U; F, J% s
- ^ w0 K/ o' e3 O(8)团队合作的一些心得
( t* A. I) @. |" g
/ H* }# Q% S5 n7 m! H8 c% L1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 5 w! V2 e t- S# [. e& b- H
2.不会乱 不会重复做功 不会丢失工作 ; d2 J9 n) p8 _ k. k- P- T' [
3.经验丰富 总能拿出一种解决方案
7 Z: F! U- f* ` q w8 d4 s( S4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 0 _2 z/ ]/ d9 }9 |6 V
5.大致方向总是不差 错也只是参数不是思路 不是算法 1 k. x4 Q' i9 g$ C
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ) X8 k( X8 W2 T# ]
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
, o- G3 Y) t2 S7 D---------------------
+ y' O# x2 F& d3 e! d% B+ Z4 t4 y/ R) X o
& O+ q, h' F! q2 ~ f6 b' w1 S, D( R S$ F9 T' N+ l6 U
|
zan
|