- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564094 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174451
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结. l- u% z! \7 }" @
数学建模大作业中涉及到的知识点总结:
* a, ^ }5 W! Y- n% C' N! N6 h2 E$ P1 t( t
(1)写作缘由
3 ]' p# _! t5 f' H% E(2)统计描述:
) n2 n4 r2 Z+ J M+ ]9 {追加用excel 做频率统计
; _" K2 v) j: e% R( o6 p# f(3)相关分析(点二列相关 ). N3 v" E6 u! v7 } _+ O
(4)回归分析
9 |6 m+ p- T/ ]9 F; j( T6 {. F% [6 x(5)特征选择和数据预处理" ]5 r/ S- T" U' t. H
(6)缺失值的填充
6 E. ?+ j. Y: }' N9 z(7)文档编辑的一些技巧& P/ N" O* r/ F
(8)团队合作的一些心得
( J& h& C( U1 U; I5 s(1)写作缘由% _4 a% ^* ]- d$ n) ~% i! p
4 E% c" {, Z3 c
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下1 }5 [) `& j& w0 p$ a
/ Q! n& ~# ^- U1 ]5 |1 n$ o) c
(2)统计描述:7 v4 o3 q9 T- M# K: J: K0 K
$ f) [ M% v$ T$ s z1 [
① 频率统计 8 w% Z, K$ }: v/ ] F
② 中位数
$ R1 N4 H! ], O: Z6 G③ 众数 ! Z" k) d# F( H
④ 平均数 6 f. X, l. z5 _# u0 p
⑤ 方差
+ C0 R1 B! t' ]. r8 m⑥ 标准差 * _' ~' O0 U5 q8 c3 \7 U* n
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 1 S& R ?" ^7 H: D# k& c
: F8 ~; m% m8 K) ?/ N6 w$ j& l) i' ~
追加用excel 做频率统计: X- b3 {6 z7 q/ b
![]()
4 Z5 b1 N, _' y/ t0 Qhttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
0 j( N6 l2 U: h! P
" @# p5 x2 v/ x- @) M(3)相关分析(点二列相关 )
) F' \. Y8 w5 Y" N9 Y3 l$ }( C% ?![]()
" ?2 R+ m) Y/ G# [
/ k- s4 H6 k) K, h% U & k$ U9 Z7 _7 ~3 `
+ l9 c9 B+ Q# w8 n/ S4 `# N% Z* o [- E1 D& P8 V- A. E7 C
(4)回归分析
0 C$ n7 b+ n8 A1 u; Z$ _) }2 O
) \0 G+ y3 x! gLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
. L5 O' J6 v4 H& q0 S& q( E7 A
. U6 q3 O1 }) \7 }7 |; S因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
5 H( [; F* G/ `, F4 t6 V' m( p
+ T m1 q# m) i- H, U4 T* U# ]回归分析一般有这几个操作: ; O0 L: i3 A" w3 Z- R
① 设置筛选条件,刷选数据集 valid 7 V5 \9 f' J* [) [0 h, a
![]()
1 {. J; y9 q' ^5 t% s4 R3 g! S# z3 s, s( _5 q; _
![]()
* m3 I: z% o8 o1 ~+ X2 N0 F8 {! t② 模型拟合度检验
J! T& v. d- c% D: r) ` ![]()
0 W' A5 W! u2 y4 D' S( J- J![]()
1 F0 i: W- O; `8 d$ J7 M$ {5 i3 M. X6 V: ~
③ 预测的模型参数
7 J: a+ G& \% Z3 E* N* W ![]()
7 I* @8 @, m: C! L& s7 V④ 预测结果,准确率9 `) v) t1 h$ p+ ]& a# O
1 C- Q1 Y7 H. ] O% q; J! C
![]()
8 R5 |! A% h, ~
* i6 u& ?9 _5 l* t U3 M$ E
: q, J7 x x9 h(5)特征选择和数据预处理, @ a9 v) S# a" Z1 a
6 P6 R2 m2 W9 h' b) s- o; c特征选择,主要是gzh的想法 % r& ~; n' k* h9 _, I4 ^% U! Y
特征筛选的思路:
, s1 Y! k' [) d6 ~分类变量用1 2 3 4 离散值
& ^! ` _$ N4 X% J! n8 J \对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 7 M1 {( k' C1 j
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值2 g/ ?* n3 O: v) M& B/ z: |7 @
" B5 n k$ J- ?6 Q( g# f- g1 d: I注意了: 5 L* l) d, o8 I3 ~9 K/ ]
筛选特征的时候,重复性要考虑、缺失值要考虑
7 D7 X- j" `: `9 R! Z+ ~5 ]2 t+ X7 N1 Q! ]! u' i0 }' P
(6)缺失值的填充
t9 N: t9 X' E% q
, q& F" k. Z* m; O* [+ J; m ) i- p) j5 ?! c& ^ G% s1 n
7 W) G, x: v! D( f) y* A+ H
(7)文档编辑的一些技巧: J+ U* g# P% o6 M! e
7 B% B- f- r5 w( p2 p% Shttps://blog.csdn.net/qq_26769591/article/details/80848841
( A" ~+ Q/ l' B. g8 ^+ A5 U$ W- k+ B- L, s6 O; E9 I
(8)团队合作的一些心得 _9 l" c' ]% `& L% ?8 {
! T6 K1 b. H+ L2 w1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
6 z# H m: R2 V- r: J2.不会乱 不会重复做功 不会丢失工作 & d% x8 I$ ?0 W. V+ D
3.经验丰富 总能拿出一种解决方案 % ?8 z! ]7 s" u: @
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
% S y. f1 H9 J- y5.大致方向总是不差 错也只是参数不是思路 不是算法
: D2 A# [( ?0 D7 z) ], g6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 ' U* t( a4 p) `* l
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线4 T6 Z8 p% ^, ~! k
--------------------- 2 D5 m$ s0 K! r1 s! N1 g
作者:-英击长空-
, D9 I! y7 B2 o& ?2 s! S* m7 }来源:CSDN 6 k+ N, z# X ^" p f$ X9 u6 D
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
- e/ z6 M8 h! g- s' C1 `
7 f% d( t# y! F- m: ~ t% m5 y' W. @) O6 [8 p# O$ F- Z
: G) a4 \" d7 x* z1 d' ^* L) C8 s5 H8 j4 g4 f. w' X, q# J
|
zan
|