- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 561221 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 173739
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结
9 f; S5 t! P. y" l数学建模大作业中涉及到的知识点总结:
. X9 H( t7 h! i1 O7 C; x- E
6 K, B* C6 i3 ~: }) W$ m( i1 N: V(1)写作缘由
% K3 S% }) _1 S$ y(2)统计描述:
4 \% u) v0 w3 F! r- R追加用excel 做频率统计
, p- \1 D X7 r+ J(3)相关分析(点二列相关 )
2 e! b. X9 Y1 q4 Q5 N/ w y3 `(4)回归分析+ _% R8 }& q" f: r& F2 c% B
(5)特征选择和数据预处理1 L I4 {3 o* t5 M0 d
(6)缺失值的填充
* Q' a) S( l. B# j" `7 U: ]+ T% i(7)文档编辑的一些技巧
0 z: @# o5 G1 k2 A0 |3 X, b(8)团队合作的一些心得
2 l f& y( @$ A/ i: d(1)写作缘由
+ d- R' E5 Z* y3 `, Q2 y4 T0 Y% o* w: w. q( H1 H+ {- Q. @( Y
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
* P& |$ ^" U6 R& _- M% ^: n! J M) A: S
(2)统计描述:) r! N3 n5 k) d' Y% H
2 A8 ]' o! m1 \& O
① 频率统计 ) U+ ~% Q% y! s: V) z
② 中位数
# P K8 D0 Y! i, Z③ 众数
8 v# e* U0 Y3 M+ m④ 平均数
5 `" J" y) i- d4 s) D7 G8 @7 ?⑤ 方差
, ^8 M0 S. T5 o⑥ 标准差
# U; S5 H# J Y0 j6 w5 b用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
; j1 x, R* E0 Y: u: V9 s
% }$ n+ X- k i( P8 S1 U2 g. y( X' b* i9 b; @! i' R: q
追加用excel 做频率统计( n3 ?+ m, C; G. | v( d, T
' Z, o3 |, y+ ^& y( _ c- l. ?1 H% X' }7 I
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html1 ~! s: J) u1 f# `8 ^0 n
! p/ @9 M5 U H( e3 v(3)相关分析(点二列相关 )
. @' @# D! @ C1 N![]()
$ y# J" U/ r7 C( Z8 y* W/ O) c8 x# |. C$ F
, L1 r) h4 N3 p6 \% k
9 K& K$ R% d* \) r+ n& d9 I) x
$ ^$ s/ S. S( a7 n3 l
(4)回归分析
4 I' }4 D' ~* }; b
! C _: t% @7 \+ l$ Y! j1 uLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
' h5 t8 e- ]6 q7 q6 V% x( `: e
9 s! Y7 }; [6 V1 E; T ~0 I因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。. x2 z7 R- F4 l
4 [2 C* _1 J' f/ }回归分析一般有这几个操作:
# V* h+ N& W ]① 设置筛选条件,刷选数据集 valid
4 [! T- Z4 ?6 \( f. ? k7 y+ r2 K) v- P7 j: c
6 s2 ~9 Y8 X3 k' W- b0 t8 i( E+ d5 G2 z
8 d4 M0 [9 Z$ Q$ N1 ~2 u5 [
② 模型拟合度检验
- K7 H6 z3 O$ y7 c1 d ' P9 }8 m* Q, I) j& u) ]
![]()
( S4 Q* X9 Q/ F0 G. z2 t, `3 h+ r$ F: T" M9 Z, I, F( Q
③ 预测的模型参数 + A2 u- W _: q$ p. i! U0 [
0 _/ {4 S* f$ C* q
④ 预测结果,准确率
]& n; m6 v1 H ?; k& _6 o, K0 E! [3 N
![]()
' [/ h# z6 k1 n+ O1 u
6 c8 g+ z1 d/ t$ r8 @9 i5 Z0 t: g+ P# v1 v) J
(5)特征选择和数据预处理
! F1 `& ^4 N9 P N6 ]9 y5 R7 q* k5 W/ c* u o. d
特征选择,主要是gzh的想法 3 m0 }# |" e7 S- x
特征筛选的思路:
2 X1 l6 |, _* y6 O- D分类变量用1 2 3 4 离散值 / U3 D# ~/ X: ?5 y2 y+ Z4 Z
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
5 _8 h A' y; n对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值1 r/ j& P. u' V. \
( K2 o% ]% l% ~' n
注意了: , }3 ~1 A- Z \* w2 R. F
筛选特征的时候,重复性要考虑、缺失值要考虑1 y- x" E# ]6 X! d1 [7 j
7 I& g8 [/ _5 i) n6 F' `6 D/ W2 N; b% ]
(6)缺失值的填充
: b5 K' Y/ t* ~7 x$ c# b2 z9 `
$ v8 g- o: O$ w![]()
4 L8 U1 @5 K) h4 d0 f* n$ S1 G( ?
, q k# v1 H z/ J(7)文档编辑的一些技巧, r! q6 J) ~* z( D
) f9 ~8 r" O) ^" O& T9 w, o
https://blog.csdn.net/qq_26769591/article/details/80848841) a% l: K2 I2 Q2 t C4 D" t, r
3 h1 `3 T9 X2 `4 Z3 o6 M5 z3 x(8)团队合作的一些心得9 S( J8 h+ c2 b1 N3 a
6 ]$ Y4 [# V# @1 n" Z1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 9 k6 S' e8 |. o* { v
2.不会乱 不会重复做功 不会丢失工作
: j8 m6 F" A1 q$ L# d+ _$ A3.经验丰富 总能拿出一种解决方案 - q. K; |) B( Q. [: Y3 e6 d
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 & O) C- o+ ]3 G' ?0 P+ L
5.大致方向总是不差 错也只是参数不是思路 不是算法
$ z6 Y3 x4 [ n' t6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 4 j8 `; A. z4 |, Q
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线/ }# N2 b8 b! X* l9 s0 A& v5 g" ?
--------------------- F8 Q, B6 v. j/ C+ J5 `7 X
作者:-英击长空-
# p4 P9 I, n0 V& v/ z' R5 o来源:CSDN
0 E; _- p" F# x9 F) X/ g原文:https://blog.csdn.net/qq_26769591/article/details/80840673 # ^+ D6 N# w8 e4 J0 Q3 J4 E
: f; k# ~3 Z) \9 \' H
' n& ?4 `5 g8 i) P0 {5 b& M; J; O
: }' I% M$ i( o1 u; Z8 T6 K7 H* T9 H# A1 g/ I* a0 p0 b2 { `* z
|
zan
|