- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564663 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174622
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: ! k, A/ y$ ]' e+ |3 b2 d' y R9 t6 |
7 g# G* l& p+ \& a4 _4 u/ e0 Z(1)写作缘由6 Z/ i, G/ i3 Q
(2)统计描述:4 v! G" J2 [" r) \$ O/ S) m
追加用excel 做频率统计
: ]6 J ?: X. } ]9 i! P(3)相关分析(点二列相关 ); m0 Y" z' L. ?' N. `* a# Y
(4)回归分析
5 ]- { m7 l( e: _4 k(5)特征选择和数据预处理3 E8 @8 I. c* N5 r1 b8 K3 `5 S
(6)缺失值的填充
% c* m s1 d( L" W# E, k) u(7)文档编辑的一些技巧
# g. c( ~3 D0 K& t8 V(8)团队合作的一些心得
6 g6 a' u1 |. k+ J0 h/ }# F6 O(1)写作缘由
6 Z# N m5 {& q8 z2 V4 G$ o# B* R6 ^
5 Q( E: S( { m: |# h9 F9 |* x在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
: q# r- O, ^- O; X0 D2 f" O8 s- r' s {: e6 u' r
(2)统计描述:
$ N& d' C' Y: g( ]3 S. H
1 J6 c$ \# q2 y6 ?3 [① 频率统计
# Z6 Y# L5 D, ?" \$ E4 W6 X* P② 中位数
' S- O; A/ E" }- O9 ^/ X0 x% o③ 众数 6 T- M$ b1 i0 e3 W- |# j+ v
④ 平均数
B9 ?* C& ^% Y6 x⑤ 方差
4 H! t4 v3 S9 q N; U; N3 J: C% l⑥ 标准差 8 [3 w/ S x: w# P8 |1 ~* J
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
! B" G) D6 Y/ T. [" k
/ {) f7 g; I) P追加用excel 做频率统计
' X0 N# w) L$ [9 f" M4 e! z L3 E! a; `, }" G2 d% y0 K
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html2 z* G( }' x5 a1 L; I' w& f
3 H0 d" [! k: p(3)相关分析(点二列相关 )/ U" | g$ A4 j0 D: A
5 ~9 w8 b! n: O, O$ e& S. B1 e1 P0 U" V" Y: t; z* E- C" J
5 ~( I3 x/ q$ j1 k
8 y) ]4 u% D* [/ G' m) j9 A
6 ~; _9 f. e7 i8 I6 g8 w(4)回归分析& r) o2 |- ^0 V0 t, C
) Z4 h8 q0 ^( e0 G" R8 J. @Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
# l+ M/ s0 Y5 Q8 {0 f7 h8 n# m' s$ ^( q! [% x- g4 q
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。. Q( {! g% K5 Y5 J
4 j, K7 N6 s& u5 W
回归分析一般有这几个操作: 6 q, C9 c: Z- V/ K
① 设置筛选条件,刷选数据集 valid
$ U: J% P0 L7 p* t$ u7 j' p
7 D, Y. B( a8 e* g/ l; h: D8 c; K! h1 |/ q
9 [) G7 B: J# ?4 y6 x, D' ]
② 模型拟合度检验
; R* H! l$ B4 Z8 {1 \" y* D# S9 [; ?0 [5 n
1 t( X% g3 Z. t |) b
9 D3 h6 ~4 c- f1 c: t③ 预测的模型参数
# a, t# G+ W4 C+ `5 J- l& V2 b8 y6 f/ l* e2 {
④ 预测结果,准确率
. U: C+ Q& I% u% N6 ], G
$ K b- Q) b& v% n; R4 O& O
2 N e- v/ o: Q$ A1 x; _# Q2 |
d+ Y% N6 [3 C5 j* J2 {1 K
- @% j0 ^& i: D(5)特征选择和数据预处理
" \* R. O* O' x7 G& ]6 O7 i, F2 _4 Y& y
特征选择,主要是gzh的想法
7 G* J& \+ j* C" [% c: G特征筛选的思路: ! j5 }8 U1 y9 X' c0 K
分类变量用1 2 3 4 离散值
1 Z. |- H9 c5 V% K* A# P+ _对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
! C& ?! m/ d! p7 c! U/ |. [1 `- ^对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值8 A1 \9 E& Z5 M3 Q
# k6 s9 H! k& T$ y
注意了: 8 D; N5 }7 X4 j. M
筛选特征的时候,重复性要考虑、缺失值要考虑 r- ^* L( W6 ^( @- V; o
8 \' v; f% a& C8 Y8 ^% n(6)缺失值的填充" ~( N6 y; s0 k2 R/ H, E
4 [$ d _1 `% U6 \# y0 Q' ^
: j8 a, W \6 ]. B
% \" T+ X. }0 m; d(7)文档编辑的一些技巧1 N1 n2 |: v3 t: T7 l
5 I' h* R" B+ R6 G4 Chttps://blog.csdn.net/qq_26769591/article/details/80848841
7 P! [* ?& A" R2 t) U% M3 b9 Z" B3 i4 O: o F& B2 V9 J- @
(8)团队合作的一些心得
; C1 X& ?. D6 g( v1 ^
9 {5 O2 j0 h# Q5 K7 c4 ?2 e. H1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 - X5 q+ e- G( o- B: b
2.不会乱 不会重复做功 不会丢失工作 3 t$ {, \( O1 R# e" ?6 u
3.经验丰富 总能拿出一种解决方案 ' u9 h- F. k$ R; J, s, c
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 5 w5 S# v; k% h0 O2 G. r# Q, ~, ~
5.大致方向总是不差 错也只是参数不是思路 不是算法 9 o, j9 T! Y& D; y4 A2 z! D' }
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
( n- ?& Z% G$ J S2 K# T7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线; B# C7 R/ r& j: M( e/ J; {5 P
--------------------- 5 I$ s+ B9 {7 j- P) s& ^( C! }
: {1 f* _- h* T9 b: I5 v- v* \9 J2 \( G' h
2 a6 Q9 g' g. h% k$ m |
zan
|