- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564672 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174624
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
A2 C7 _ Y, S+ s$ A! O: T( F7 w8 l) G' R9 f" }
(1)写作缘由1 Q4 o U" o% @
(2)统计描述:
# g3 M3 O. T$ Q/ R追加用excel 做频率统计
# D I/ W6 _& ~1 ~(3)相关分析(点二列相关 )
. R" M9 ?9 G9 s; h0 j+ K4 c(4)回归分析& \9 e- n7 J( ]; t: ?
(5)特征选择和数据预处理4 c0 _! n" l* o
(6)缺失值的填充% h q' F; o8 ~
(7)文档编辑的一些技巧" }: [9 @; d+ e: b
(8)团队合作的一些心得
- L! d, x1 G4 A7 x; B(1)写作缘由
6 [) N% F6 o4 f; G+ b: K- C# K5 Y( k3 S9 W5 _; B
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下# d5 P: {; e2 N% S; b( |
8 R+ ?; W$ R* p+ [
(2)统计描述:- {5 }7 d+ H/ y( H
! R3 S. d% p5 _5 L2 ?; H! m9 v① 频率统计
" B& ]' J& i8 M: W7 M Y U② 中位数
8 L% I/ ~5 }& g( ~) d8 h( j R③ 众数 9 {: a! D8 k6 K; ?1 Z& i
④ 平均数 ' L0 s S$ i5 d( h$ `3 f
⑤ 方差 ! }6 S, z$ e$ c8 a
⑥ 标准差
4 a! x$ d. p" m用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
6 D6 E; v7 }$ ~9 v t6 [+ `) y1 ~. O$ ]+ i0 f8 B! s3 C+ W7 }
追加用excel 做频率统计
3 C( }2 p0 g" J6 ~( L+ b7 [% D3 R6 i; K, n
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html; _# ^3 t* m$ }7 i4 N) R
- O1 u \' X( W' b8 x6 R2 L1 e; N1 R
(3)相关分析(点二列相关 )$ p7 f% o. a4 C G+ ?6 q5 V2 e8 B
: g, z- `7 R0 r8 H n
9 x+ t) [- Y' S& ?! N/ N' a9 f- V2 J- f& |" l- t7 F
8 e! p: [ \0 r5 G3 o4 K' s
* s& j8 M" T; ]2 {4 L5 h
(4)回归分析% y1 G% D& f3 v
5 Q& O5 I' V# A. W/ |& zLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
7 ?6 v) c+ Y5 N) o3 G( q: X) W7 V! E' V0 n; D" l$ g6 l
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
0 [: O1 O& R, y4 x1 n: _& @( s" f* f# H; G9 i/ o
回归分析一般有这几个操作:
/ e) g0 y' C3 C; X6 K; d0 H7 C- x( \① 设置筛选条件,刷选数据集 valid
6 N; }4 @* N9 F" Y3 W$ [( c% ~! i1 w" Z6 t
0 B" G& e% p$ ?1 }+ e
4 S6 l A8 u& y) V. Z! `
② 模型拟合度检验
$ ]/ I; @8 p7 t) {/ o. g" z& E1 {) K
, N6 {, N F5 M" i8 P7 v! r
, V+ e" W3 P7 s' l③ 预测的模型参数 ! U1 p2 g% g! R5 K% l' L* y
* l8 t% {/ K8 ]% B1 u+ a( ~④ 预测结果,准确率" `, B% d3 h, @$ v" N* J
B! I1 G8 K3 f( W
4 \6 q4 s3 }) d r
8 q1 V1 C A X: y: P( A. B
+ j" p6 T; C2 o; c(5)特征选择和数据预处理, a2 {% u3 C. c. N4 x
% b$ k# Z9 m" h$ q7 o9 A c特征选择,主要是gzh的想法 - w( g7 K' W% n/ Q& G* q2 }+ {) i
特征筛选的思路:
* f1 l; b( r7 l- s8 }# v6 U分类变量用1 2 3 4 离散值
. y x t& I/ A8 A( m U对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
/ p* Q* Q; c% c0 N7 c0 z7 @对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值; N f0 S6 j4 q! G4 {3 f
: o" D: e# Z _+ a( |/ v
注意了:
! }0 T# i* |; n. J- S* j9 u筛选特征的时候,重复性要考虑、缺失值要考虑
6 s3 M# D2 c Q+ a- u; c6 l: `: y
(6)缺失值的填充; E8 [8 L* X e ~( ?
5 X# P* W7 K: o0 b
1 X+ U) z4 g* |. G! L8 }
/ j" |3 K) W$ q. j; Q" Q5 I(7)文档编辑的一些技巧2 |1 c4 m1 @. @, F. U
5 ~' s& h# k% E' shttps://blog.csdn.net/qq_26769591/article/details/80848841
n0 P2 f3 t# C* H, @* M+ i0 O3 ?7 v9 ?) k8 @
(8)团队合作的一些心得9 K/ p4 r) P! m Q6 }4 j
& G; _7 T- {7 Y2 V# r2 J1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
# i5 x9 o( t. K2 R2.不会乱 不会重复做功 不会丢失工作
0 w3 k& D+ I) V1 f! C/ i; D3.经验丰富 总能拿出一种解决方案
5 q8 k% }& O5 N4 l5 i4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 4 r! f$ Q$ ?( X$ y; O7 m k9 c
5.大致方向总是不差 错也只是参数不是思路 不是算法
7 e$ P# y. [5 W; K% t" g7 c3 ^6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
' R! ?' @2 u$ L1 ^3 p' _7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线4 k& U1 T8 g2 a8 }; E' E& ]
--------------------- 4 n6 d( s* W+ z
1 K+ Y6 z1 E( f
5 I' g- K- m6 ~* F7 X W. X% G8 O
1 D. W: I- y+ j! _, @ |
zan
|