- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 558271 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172854
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结. e; o0 {+ `+ \5 ~2 o
数学建模大作业中涉及到的知识点总结:
9 @, w9 B; ?4 `/ T' R1 u( B8 r1 c, D. |( h/ W6 m
(1)写作缘由
/ w0 g$ W( |+ q2 `- v' N(2)统计描述:
3 S7 \$ I) P. T' J5 K追加用excel 做频率统计- g: T! \0 ~# a! g0 n( n$ s
(3)相关分析(点二列相关 )
, _" k" e4 N8 |9 s, ]' [(4)回归分析. H2 ?0 E$ A' h& r+ w. ^! h0 {
(5)特征选择和数据预处理
7 i3 s ?, r9 q7 w9 Q% }(6)缺失值的填充8 q' ?! S9 O' h3 H
(7)文档编辑的一些技巧2 T2 E# [6 ?: }
(8)团队合作的一些心得
3 K2 j* t7 ~8 I0 M+ E- D r# w(1)写作缘由; Y) S' b8 t U( m ?
5 j" Q8 Q6 @: n# N; E/ N
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下- }4 {. D- N8 u1 X% N5 S A' u) k7 W
2 T* X7 N3 I" o0 ?
(2)统计描述:! h7 }' W6 _/ X- @" ~; g- T& n
5 q, J* v9 u" D+ z4 t6 Z
① 频率统计 6 X8 E& `* d- w
② 中位数
' l" d4 B& L) d& o1 U( m7 Q③ 众数
* w3 A- L6 I' s( k3 U: A④ 平均数
) Q; r. z( h4 }' J5 n⑤ 方差
$ l) P9 l# s% u) H g' {) n⑥ 标准差
2 N+ C. a# e. C$ d; g用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ; ^( c* \) L7 _/ t3 Q" C* |
5 W& O. z3 t3 f6 _
6 r1 ~( W: r: u
追加用excel 做频率统计/ A, P5 b4 r+ E5 i6 S) F, h& j
j7 {3 y# J4 f$ |
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html- j' S9 |' u* n5 N" r' [' w# M* U4 g
" f' U) X8 S% j8 r P* X E% Q0 }% n: L(3)相关分析(点二列相关 )6 N! f" l9 P7 N/ C: `) S! Q
![]()
! v# T+ M( P' E8 T# W8 P6 A# ~$ m# X, H. @- t7 S! S$ L: X
5 U& D" [" l7 e, s2 M; G
) Z- T0 j: ]. n4 ~
3 J4 w& f w+ T. Z% v9 G5 d: J9 `" A(4)回归分析
: d$ {0 V. d7 `
+ t4 z2 R- _; n1 L4 O# W" v6 ?% ULogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
! g9 B }$ u+ E6 `6 I2 D7 y$ ?( d9 B9 l9 @) W2 [6 }
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。; ? |7 b& H5 D, g) Y
' a% r; u6 }$ Z# P5 v6 Y! f" J, d) Q
回归分析一般有这几个操作: - W/ p( T+ [+ G7 q+ |' T0 x
① 设置筛选条件,刷选数据集 valid 9 S' i+ a( i& q# M2 | |; c9 A6 q; q
![]()
% |: F7 l* _% u! N
7 Q( A F7 z1 n5 W% R# Q 4 a; D; M, V1 t+ y% M S- S
② 模型拟合度检验 # o9 m) |. }+ G' X
![]()
7 V% F/ e. [* ]* [. G. D" _![]()
* Y3 I6 T7 E% D& \( q" j
) I2 {% I: D; V0 J3 A; f' c- e, Z③ 预测的模型参数
) H$ c5 D) g' }% D. P- Y0 k4 p # M" H U6 J9 F( b: A
④ 预测结果,准确率
1 b7 T# a. _4 C% ~![]()
3 x( s8 b, f" x. y$ q* v( n0 q9 E ![]()
: B3 |1 y$ I1 ~1 l& Y: z5 A# I
. A* L2 ~ i/ G0 G4 x
! o9 Q$ f% Y9 `( F) g/ A; d# T(5)特征选择和数据预处理 Y, H6 S$ W9 d6 B) I" Z
/ i r/ N9 [( g s b/ ]9 K特征选择,主要是gzh的想法
# e7 b- ]" n; i. m特征筛选的思路:
7 O" q2 l5 b7 n ~1 L分类变量用1 2 3 4 离散值 $ m0 {6 {3 c5 U k
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 9 m0 l; L- P6 _; \9 `7 ~
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值! X! U8 R8 F3 B1 O5 D7 z
! q& h( Q: k. {' `7 i6 k2 K" ?9 k
注意了:
* h# t( q5 F! A( {3 T' n v# e" r筛选特征的时候,重复性要考虑、缺失值要考虑: ?; T* G) v* a$ q0 x" p5 e" `2 T
- i- o0 T/ u- h. |+ ^5 _(6)缺失值的填充, K; [' i, g6 X
4 p+ h( q' F: X2 B0 Y
2 d6 o; E& q! Z; @0 w" t& y, s
" o% x2 n7 s( j' Y5 B& X( c
(7)文档编辑的一些技巧
# v# k+ b6 v: ?9 W2 S: v4 d
2 N: y" M$ J( H6 Vhttps://blog.csdn.net/qq_26769591/article/details/80848841
" }. Q* S6 D/ H3 {5 F
/ X6 d( T2 _4 b3 b(8)团队合作的一些心得
. E9 I' F' b* T& ^- q7 F o% S8 x, e; A
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 # G- n) i5 v! I2 ]0 d3 h: i0 ?
2.不会乱 不会重复做功 不会丢失工作 2 z9 p" W. A9 S% J f0 W8 f5 s
3.经验丰富 总能拿出一种解决方案 / {' s5 X9 ^; r* S2 G' n
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
( B& {; Y6 u3 ^8 \7 C5.大致方向总是不差 错也只是参数不是思路 不是算法 2 w$ G J/ t3 x4 q# M
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
9 v. X3 e& l9 f0 M7 L7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线5 ~( U0 b* O; t8 J) n
---------------------
. M! Y9 h8 ]: E作者:-英击长空- . s; m4 J5 p! _9 {, a6 N
来源:CSDN
: W- ]: {2 v- o5 _, E$ L, y原文:https://blog.csdn.net/qq_26769591/article/details/80840673 ; B! O3 t" _5 Z! E
0 `% y# H+ w$ j" r: N* X
7 U9 n) E. _- M; \* y. g- U# p% Q3 i
8 m9 o' f6 w0 Y, C% O) J0 b
t A5 s$ C) n# g, E |
zan
|