- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564709 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174636
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: 9 E, U2 m2 ?1 H! z. i) W
* Q7 b& C) ^* f+ M( @$ E
(1)写作缘由
" P" b% B+ I" k) I6 e(2)统计描述:
4 R/ K" _! E: p [" V# U追加用excel 做频率统计& `7 u$ ^2 P0 U/ Y0 n9 Z* {
(3)相关分析(点二列相关 ). R# {4 c- i) f( e; ]; |9 x4 T
(4)回归分析& U8 j5 {1 t9 i o# W
(5)特征选择和数据预处理5 Y: T. m( D- M+ \
(6)缺失值的填充) q6 ^2 K. l& p% a6 k: V
(7)文档编辑的一些技巧
. c+ r8 m0 n e1 w4 R/ ~(8)团队合作的一些心得( a$ Y1 m* x) a& \$ b9 P6 x
(1)写作缘由
! T7 z4 v% h9 ^# W7 ~9 b( d' P5 B" T6 H9 f
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下0 e% i; E! _/ X0 h. f/ Q9 p
/ _' c: A2 W$ x- J. k1 }4 M }(2)统计描述:$ N1 e2 S( m2 l! \3 j
3 L* a' _4 ~# i$ D+ c2 P( v6 J4 j
① 频率统计
+ K2 r# q) `5 ^* \+ X2 l# ?② 中位数 / l6 j3 l7 M* b& r& Q9 T: x
③ 众数 1 Y& ~$ m6 I/ z9 `7 y
④ 平均数 3 q) L4 G; Y; d0 [$ y3 w
⑤ 方差
L4 `8 F1 T$ _6 X7 e/ ?⑥ 标准差 1 i! f, k7 n" P1 y* q
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
3 s \2 t1 x9 j, G c2 \8 \) M3 T9 o1 b& e
追加用excel 做频率统计$ u9 g) w( H1 T
6 ^% ?$ d9 l- u# r* J1 [https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html8 i6 i* R1 F* o/ G
% c$ |' m. v6 |, @# p2 g
(3)相关分析(点二列相关 )
/ m! Y( f+ V+ N! X: _0 Z" ~" K' P' A, i& ~+ b$ R/ @: a; K4 V& S% ^
, B( d3 s# Z& f1 R* g/ r: c- y7 f! _9 N; \ O- z2 ]& Y7 g7 _9 u
7 r1 D) _2 [$ t0 z& W
- z; H, K- _3 p3 S(4)回归分析
( M; K. ^8 Q4 W# X' F4 l. V
4 N" M( D6 {% ^Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
; ^3 |" l- S5 C9 M! Z6 T, Q, C6 x2 w" W& I) `! V4 A2 ~
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
- ~) ?; P1 l- i' @$ N# {# w w7 |
) D5 d% u$ M2 d, u. m- K, u回归分析一般有这几个操作: + U8 ? X/ v& f# `) q3 m) L
① 设置筛选条件,刷选数据集 valid
( p* m* V- a( `% m& j0 x8 d! e; I( W Z& {& q$ L2 R$ k* q3 s
4 J6 J; `& u9 v5 g* j: C
7 P! S5 C, \0 A) c+ u
② 模型拟合度检验
0 G1 Q- K, l9 n' g1 `
# F+ g0 @9 p5 C3 ^- T
5 h* x5 [# E& r# R8 x. R/ Y7 Z4 W) \' A& |+ P
③ 预测的模型参数 5 J, L5 A. n o+ I, B1 N
, T9 G T6 {4 t, m. I' \④ 预测结果,准确率
! s$ f0 `- E9 }+ G, p9 x1 q
$ N% [, W' {3 U4 t3 m# [) ]
5 r# e+ |- y0 n2 g
) p, X1 k4 u# w: u9 R( F% s9 \2 u" p- I9 d0 o: u0 ~ [. L% f% v
(5)特征选择和数据预处理
$ z# h) z: A- u! B. C$ c
& Q( M$ ~# c3 C( F$ ?. C特征选择,主要是gzh的想法 6 c9 L6 P2 j+ k
特征筛选的思路: - b7 [4 N3 B3 P- j& q
分类变量用1 2 3 4 离散值 ) S, b5 d/ t- d% P3 C
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
& {/ A4 {4 ]# t: H' R& }! _对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
6 e& ]- Z& r, O# O$ G
8 k; E! {% b3 E- e; {注意了: + \3 B9 a& Y1 U* k
筛选特征的时候,重复性要考虑、缺失值要考虑5 S/ g- R5 X" q; P$ m. X
! ]" e2 H1 k; j* H) \(6)缺失值的填充6 B# K- v8 p0 Y; d! w
3 t6 B: @3 C# X7 P& [3 Y) h& _
/ Z( w# ~) j/ L) C: R) F: G" T `+ J" g0 }7 s+ U* |( a
(7)文档编辑的一些技巧% d7 r. Y" e9 T6 E4 n7 q$ X9 c
; C4 U* R# e! o% S; Y2 H: G6 r5 \https://blog.csdn.net/qq_26769591/article/details/80848841
1 l. z, w8 `9 v1 \
9 [# j8 y( j3 `1 A+ d(8)团队合作的一些心得
! R4 L5 N0 a* T2 M- r
' g( T% k1 v" d: B+ P1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 & R7 a; l2 j q$ @6 [) {
2.不会乱 不会重复做功 不会丢失工作
3 f* n7 ^! M( S8 x3 ^6 r3.经验丰富 总能拿出一种解决方案
9 a' v/ e; L9 z, }/ o4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 ; a! x1 W! T9 j5 O1 U( l
5.大致方向总是不差 错也只是参数不是思路 不是算法
2 h5 U# Y5 k% H! m; `$ H6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
4 V6 ~% P. ?8 _8 S1 {4 U. s7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
$ K- X1 o$ l9 X3 B0 t7 K! Q# c--------------------- 2 H/ m( Z) D' m9 b
$ o" B& h+ R% d, y
5 E5 p% D6 h4 I* O. x
4 _4 x l/ v( j/ D# J7 s
|
zan
|