- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 558304 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172864
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结
' K7 l/ e' V/ L' i+ O2 M4 {数学建模大作业中涉及到的知识点总结:
9 o$ s5 n7 v, o, K3 Y3 {# S' J8 @) L$ ^/ B6 Q5 R7 l( [
(1)写作缘由
: d- k5 D; T$ P$ z K: v* p; a9 n1 E3 }(2)统计描述:
. ^9 H/ g$ p- d, h追加用excel 做频率统计
: M) H) G! V- W9 S2 _; o$ P1 {(3)相关分析(点二列相关 ); H, I5 D! V6 V
(4)回归分析
8 _; \4 D- ^- f# H7 |(5)特征选择和数据预处理 D- r9 B& W# b' g2 q6 g6 K
(6)缺失值的填充
; ~0 c- f7 ~8 @2 F(7)文档编辑的一些技巧
# V6 ]8 @# {0 ?( N) K: M# x4 E(8)团队合作的一些心得
# \+ T- j" S. ^) z1 H(1)写作缘由8 R" P' `# F' T; N
) y' ]; A5 E6 p; u* S* K# q
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
2 B; G6 n; k4 W7 D0 F# E; H1 q2 _% W( M4 j
(2)统计描述:" E: L( M2 F4 _# _1 T R, Q
& e! f$ y& `5 `& n( G5 \① 频率统计 " y5 b' o" N) Z" O, n
② 中位数 & q* i# }2 x7 ^
③ 众数
9 G5 w' p- P% g! h( w④ 平均数
1 c9 Y8 i; }+ s1 X⑤ 方差
1 x# Z: {$ X! M- x* g M⑥ 标准差 0 a7 | z6 L+ ?& v
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
7 I5 m( ~& J$ q; y1 R. o
- W) |# D+ p1 y! z& U+ O( g! F% n
4 ]$ _4 C; C' ^" T: \追加用excel 做频率统计
* h0 n- z) ]9 c5 W9 G " R, z) L6 T7 \
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html* X/ p, f: l M _
' |* q/ U, ?; X# \, q. o- s( X(3)相关分析(点二列相关 ). K0 O, @% e' p0 _5 g
+ Y. F0 b4 D9 m; w k
7 X5 K: o# |. p- q( x1 a 7 g" o/ e% P K3 O+ q* m# R H
! e/ H# c# k: w
. r( R2 \+ Y+ s/ }& H; E5 B
(4)回归分析3 P2 w9 r8 K- J) `, z; B
" r5 O5 C* Z5 N* Q7 g2 r, OLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ [9 \ @% X x2 C/ L
+ @3 A# K0 R: }
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。0 I" I" R0 `9 m. l* p# K+ @
# L( f& i& _+ h. y回归分析一般有这几个操作:
" w Y1 K: b5 _/ o. H$ h F1 v① 设置筛选条件,刷选数据集 valid ; C9 c8 I; P) F- K w& Z1 T
2 k# w7 x- r( L7 N( j- l
* @0 v4 ]! f. j$ u, e " t8 y- j4 C4 Q9 v- q
② 模型拟合度检验 % R) I; `' z& A. \
+ S$ F8 Y# P, m' Q4 V* T/ I1 ]
![]()
; K, p$ t$ c+ T# H3 k
5 h2 u- _# f/ x③ 预测的模型参数 % j6 N8 W, T+ }6 N6 Q
0 S1 d" j' ]0 [- q2 Y
④ 预测结果,准确率6 w% x0 d1 f! H k* q
: b7 ]7 W" f$ _
![]()
. ?, h9 f, T3 Y8 |( Q! n1 z: F! M8 Y' D/ H! S. S
, b2 D4 W- n3 p+ ^1 L* l
(5)特征选择和数据预处理
$ S% P& j0 ?2 C! i4 b* B! y+ e2 W# U: p+ H
特征选择,主要是gzh的想法
( J p N1 w# y J- C' H+ q. d. ?特征筛选的思路: ; ~. t7 }4 ?. T: k* `7 Z- j
分类变量用1 2 3 4 离散值 : c7 q1 c8 b: K9 p
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
! I. A/ t* t, a+ t, b& i对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
6 J& B4 a/ V t6 S I3 C4 {- H/ A3 i" V. E1 h
注意了: 0 }$ D5 ~# E/ R4 |- G; r ?
筛选特征的时候,重复性要考虑、缺失值要考虑( x/ F0 e3 m+ o3 N+ [/ V
' U3 |/ ~9 i- v( x2 `# U(6)缺失值的填充5 x. o* R6 a# m. v0 ]' I( ]! {
% ^8 D. |$ B$ C7 z8 s) V![]()
# S3 u4 K/ D- S2 x% S3 K0 A- u* _
(7)文档编辑的一些技巧
- B/ y! S5 V8 X2 w
. m9 u0 r& H' C+ _# B6 _https://blog.csdn.net/qq_26769591/article/details/80848841
! H' U- R6 M" `$ k
6 G7 o2 ]" M# }: T(8)团队合作的一些心得+ z6 X- G" ` o# T3 u
$ }# Z5 U* h' K6 }0 n1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 0 X) Y9 p7 w7 ?8 m3 S2 r$ B: s, K
2.不会乱 不会重复做功 不会丢失工作 & E. p2 Q+ }7 o. m& A
3.经验丰富 总能拿出一种解决方案
! d6 W5 i2 `6 ]2 V& R+ \4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 & _* {& |3 v" A. A: ^- ?& U7 T
5.大致方向总是不差 错也只是参数不是思路 不是算法 5 ]) n: N- O X% {
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 * i* I/ \* @. s# w
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
7 R' N1 z. P3 q4 j" [: d---------------------
( Y5 ?2 c9 ^; F$ I/ P. R6 z作者:-英击长空-
: }2 t5 }: f; V; }0 H来源:CSDN
6 I$ X' d% e( c. l0 r原文:https://blog.csdn.net/qq_26769591/article/details/80840673
^ q7 v: u0 G" g5 _: d) _ G$ r: z% X2 A' p* Z8 R
/ M, J' T) v+ P: {. Y% T- M5 N
$ D1 t1 g9 e/ I+ f& @7 f
' K0 W6 ~; C* O$ \4 k |
zan
|