- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563411 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174246
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: # [5 ^0 v# e# R$ m8 J( a$ U
/ i7 E) B* m5 t0 H# Z" f
(1)写作缘由" m! h, a* F: \0 ^1 I
(2)统计描述:- z9 L n& C" h5 N6 S R5 u
追加用excel 做频率统计
8 h0 c$ ?% { u4 n# W& S( _8 D" F(3)相关分析(点二列相关 )5 F/ C1 v9 q# X% d
(4)回归分析
. N8 c8 k+ i5 ^5 @(5)特征选择和数据预处理
3 d# G# ^4 S' U6 [0 ](6)缺失值的填充! \1 @1 X6 o3 D2 t
(7)文档编辑的一些技巧2 ^+ G/ m* w) k1 f1 q, ^. ^
(8)团队合作的一些心得) G ?7 p/ a8 x
(1)写作缘由
4 d( p9 [# c. M2 w6 x( ]* e* y* r' U
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下: b- a6 K; p: \+ d" g- a: M% A
: Z3 v8 \# H2 b! ~(2)统计描述:& P+ v9 g( z+ R* P' f
/ S6 U# J* C3 A$ M
① 频率统计
/ D) {! d5 {" a8 g2 x+ z② 中位数
) \: v5 y% {( O# `③ 众数
( u I0 Q' c% A$ Q9 o' `" J0 C④ 平均数 % R, c, e5 G( }) J# J3 A! w
⑤ 方差
6 i6 N ]/ g& }9 ?( E⑥ 标准差
6 q9 t+ s( ? j: o- K用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
$ p* ^6 S( g5 d! P6 ~' P9 k) h4 P0 z( ^1 j3 e2 |
追加用excel 做频率统计7 r9 a6 G1 w' r5 h
; u' w f* ]( ~2 o9 E$ _4 ?; U
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
9 G; L& w, m! l; R
+ X f- Q9 Y& g9 }(3)相关分析(点二列相关 )
@$ O3 D5 y0 J# Z: r5 A( e
, a$ I7 I, u3 l+ M3 Q( \4 i8 A0 T
+ u) x# K/ S' Y
4 u$ `7 J c! B2 Z8 Y) a1 x, y+ e
. g; A; s5 A- s(4)回归分析
4 ^( S/ z6 v9 E& D9 B# u+ \6 {7 K
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。. ?5 c& i; E6 Q5 W) S( N
( E' z9 v' _% X2 P因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
5 I( z* L9 f; M8 `& u9 ?: G/ x, ?: [6 j/ A# z) p1 @
回归分析一般有这几个操作:
2 l/ X0 j4 H1 w① 设置筛选条件,刷选数据集 valid $ h( Z5 B8 ]6 N& U+ L6 o2 i
& y% E0 O* K, t6 M y2 s: A/ Q& z; @# u5 _# h V8 @7 H" w
, A! x5 n( r) [/ ~
② 模型拟合度检验 + {1 N9 }. C8 J0 r
4 P* ]9 Y6 E u6 m: r1 [9 e' i9 `) {2 r2 ~4 f& G. g( v$ G; d
9 C6 S* x7 u, }6 X8 F③ 预测的模型参数 . K4 X. s2 k3 b- N( b2 L7 d
i$ \- T/ {9 V6 R④ 预测结果,准确率$ n6 P5 g7 [3 u: b! _: @) N
1 C9 q* n, }& y- ^1 q _' n+ w! C: W7 L$ g
1 H1 c& e% U8 ~9 h0 @/ x
( m0 O) d7 V& F$ q7 L
(5)特征选择和数据预处理
- R5 ]. T7 @) ~0 |& _7 [6 e8 h; | ?" m' Y2 w. r
特征选择,主要是gzh的想法 / R- X4 M% Y. [; h: H+ ]/ @# c, C
特征筛选的思路: 0 Q" i$ V' t" O' {
分类变量用1 2 3 4 离散值
/ d% |, M* f4 n }+ A9 H c& |对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 4 [/ H1 x& o* m2 W) \* ~
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
( i+ k$ r4 \% E# t! i/ ?$ t9 O+ x; g/ i% U+ G% L
注意了: ( f! n6 e$ z/ P+ c6 D: m& Y% H
筛选特征的时候,重复性要考虑、缺失值要考虑9 n5 `. v ]9 l
* G- Q5 b, K' d4 y( L; y" H/ l, ~
(6)缺失值的填充3 H8 J4 p3 c, x4 E( Q
0 l; H) n4 P" a/ j8 d
$ w6 T' m+ _" r6 ]0 W! L" [' J8 S
) ?# a! y9 C3 F, o0 I" u: x+ n(7)文档编辑的一些技巧
+ Q5 J' [# g5 }8 Q7 ~6 {8 q! P0 c2 v% X
https://blog.csdn.net/qq_26769591/article/details/808488412 i1 h, N* A: `# y9 @* a
: x& l7 A0 i9 v. ]8 Y(8)团队合作的一些心得& n0 u, I7 z4 {" L
9 ~$ q& t, Y N# L O5 e# ^$ w S( ^
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 % t$ n; a( x: G( \
2.不会乱 不会重复做功 不会丢失工作
0 h2 j# p q7 o& U2 y/ R3.经验丰富 总能拿出一种解决方案
2 r$ e# _& I' Y8 v6 I/ W4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
5 x. g8 i ]+ d" T$ j! g& `5.大致方向总是不差 错也只是参数不是思路 不是算法 / X5 g; u: l. i' H
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
7 }3 e. b! b: z8 \0 _7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
: v/ }: M o4 e: I--------------------- ' y) `1 {6 f' ~, H' W. X1 a; h0 F) [
) w# W3 a K2 W) q7 h8 v
7 I/ ? k7 Z5 ?' Y, Q
# j3 N9 B/ F1 l" m# H8 g |
zan
|