- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564904 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174694
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结8 B: _6 c) _/ o7 r' U- b
数学建模大作业中涉及到的知识点总结:/ r8 Y! v4 K) M2 L) A: [
1 B* R! ~6 `& `
(1)写作缘由
" ?. ]1 E, W0 \# Z(2)统计描述:
( x% J) [/ e- d4 ^- g( M追加用excel 做频率统计" ^3 b" P, x8 T5 M$ ^
(3)相关分析(点二列相关 )0 B% ~- g3 A% V$ b
(4)回归分析
; N+ I; L3 P, M8 C6 m(5)特征选择和数据预处理& Z3 ~2 R3 W% T% ~
(6)缺失值的填充5 g4 H# c0 T+ }6 C7 [1 N
(7)文档编辑的一些技巧
4 g, H9 N, U* |' u4 Y) h5 k(8)团队合作的一些心得
- c# o, R& O9 `- I(1)写作缘由
5 |+ c$ C& k5 |! w1 G) R `( T1 ~
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
" f: ^4 S) ?, Y/ }% F; S7 g8 k# ^$ U/ Z+ ]
(2)统计描述:
, [3 ?' K: a" f: N# r& t
2 n& O( D- L. c# E* T: f① 频率统计
" s; }, R: p$ N5 O: L- Z1 D; v② 中位数
5 N @1 I |4 }" {+ j+ P0 R, O③ 众数
: O3 i2 E! ?" f5 a z: e/ `④ 平均数 4 x; N0 \' d9 I/ J' ~* {1 V
⑤ 方差
2 Z, T% X# ]9 G0 I2 e& `⑥ 标准差
: J* }5 H7 b1 m% R$ q6 O" J) q! r% a用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 3 D9 O) Z" ]: C
, Y4 i6 |8 X5 p! A
2 Y$ r; q+ Z" R$ J追加用excel 做频率统计
4 R2 C v ?# |" E- A * d2 ]0 z; v. Q; D, }$ Y. b
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html0 g6 h) I& k# g% w
; S0 {1 z2 Z0 l a8 V1 B$ V
(3)相关分析(点二列相关 )( v' p6 F6 a# D/ c
4 ~, j: d/ A8 k; j, C1 o$ p4 D
' P" o6 J1 d/ G3 y) Y+ ^5 Y8 M
![]()
5 F2 U5 q3 e6 g& @5 H
( _1 w9 m0 O3 u' x
7 f5 L. L1 c& _: z/ z" s* h(4)回归分析
" G% M X2 H1 P/ q+ Y: P
( c/ a8 I" N) t& A2 a. v0 Q! @Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
. T5 I; w# J5 ]1 r2 |. {' [
6 W. N% O* s. M% A# T/ o因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
/ |/ M9 c6 ^+ s( V2 ?8 h5 o, g
回归分析一般有这几个操作: g$ ~7 B: ^9 L& e/ N! h; z
① 设置筛选条件,刷选数据集 valid
& d6 b( V/ f! t4 V! M( d0 t% y![]()
7 d& n$ { O& X# l0 [, j5 X+ r) y% a% s! p& H9 W
![]()
6 l+ D# h- r" L7 p2 X② 模型拟合度检验 5 G7 e- E# y$ A9 |3 J2 C; J
v+ J- `" H; [" Y4 e ^
![]()
7 T" a2 i0 k5 |$ m3 ?' [& t& I1 y" G2 q
7 ?) T @* c, t2 m) ~2 b: ~③ 预测的模型参数 9 t2 W+ l) Z9 c' x
" J5 V' o# q+ b4 {0 z' [$ z
④ 预测结果,准确率
* }9 I3 r1 f9 |- O1 ^+ N + ^: ~) {3 R# b1 K) u
4 g$ |8 u5 G9 i" W1 {
7 R& L3 r, s! s& |% ?$ [3 b5 }0 d
* r6 c' G5 l7 ?+ y- q
(5)特征选择和数据预处理; o$ H U% }6 Y! x8 t) c8 ?
6 q% J0 f& P6 S9 L特征选择,主要是gzh的想法 , W T* a$ ^+ {* D
特征筛选的思路: L1 _: R6 s, l& r( c! J
分类变量用1 2 3 4 离散值
: D1 U5 I: Q3 K2 f对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
6 x. n( D6 Y( K$ p r& p对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
# s1 d+ n8 U' r N
0 E4 u2 V$ ?0 ^注意了:
: ^' w5 d( i) k' s筛选特征的时候,重复性要考虑、缺失值要考虑
8 D1 @( q1 h5 W' z s1 Y' a7 O; G n) N* _
(6)缺失值的填充; [9 ?2 F6 F1 s+ {# l1 v
8 }0 m3 ?/ n$ `. r H
![]()
( f9 U5 K3 M& p" O
1 R1 m0 Y& P# Y; Z(7)文档编辑的一些技巧8 x n# f, D4 Q6 I, o Y( r4 T1 t
g$ _" D3 l: V7 w* g- T
https://blog.csdn.net/qq_26769591/article/details/808488410 H; S7 y: N+ \; H- _! z$ _5 Z
* C( S9 w: y% q
(8)团队合作的一些心得
8 P I, ?- y) o, x# S9 C$ R5 e+ v* [5 p: v$ y; _- }+ D
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ! ~2 Q7 {+ l% ]9 k: z4 g/ k x
2.不会乱 不会重复做功 不会丢失工作 ( P& y, x4 D+ f1 p; u
3.经验丰富 总能拿出一种解决方案 ) Z# d' M6 R- P0 q. _' X
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 $ B# l6 `/ R3 j5 d8 [
5.大致方向总是不差 错也只是参数不是思路 不是算法
r4 p6 x O6 e; y% j6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 " p/ {- ^4 P! i- C4 n
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线. p& b! v+ t) b# i# p0 N
--------------------- R' v0 M2 j& a6 Z" s
作者:-英击长空-
- _4 R5 ?* H2 e0 O来源:CSDN
F$ ^- C/ E& P( G* S! x原文:https://blog.csdn.net/qq_26769591/article/details/80840673 ) P' m6 Z( T6 j% L+ I7 U$ P& E" V% c
9 V1 M6 t4 [7 {. ?3 [& y) U
6 C# c2 _/ b/ w3 B$ e5 e7 t# [* C: Y# h! l4 @! [9 G
0 n( I$ Y! ~0 l8 w$ J
|
zan
|