- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 554671 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 171774
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结: 2 f6 x" ]8 z+ c# g- N. l
+ T3 e3 c/ f, b5 X& I! ]* M
(1)写作缘由1 x- l) r9 h& I& e6 C
(2)统计描述:
/ H% V1 y% k3 E9 ^# ?2 z2 w追加用excel 做频率统计
# x7 Z) y% n0 n) G' h- H. M(3)相关分析(点二列相关 )3 ^) I% J! L( s% Y% M0 W
(4)回归分析
8 p1 Q7 u0 o8 Y7 X" T(5)特征选择和数据预处理
n+ b9 o. |! F5 U' H, f' X: S(6)缺失值的填充1 L3 ]. a& B' @' g# L! E
(7)文档编辑的一些技巧
# G A9 p, O& M. Z(8)团队合作的一些心得- u r2 ^4 w$ l% P/ }! J( P" v
(1)写作缘由$ w7 G) V4 R" o r; o3 `" b
* _$ i8 {. V5 Z7 J5 y1 q
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下( R" `/ J+ w( u" V
$ O8 O! k I- n9 L7 B" S9 H9 d(2)统计描述:
E+ V' c( P( v0 w
; |. m, n- ]0 \4 J' i( z0 x( L① 频率统计 ! m* g: F2 B O3 W& h+ U
② 中位数
9 G: C) V& y1 b8 l) {# g- R③ 众数
2 ]( b, d6 a4 [( _④ 平均数 8 ]0 ?7 Y( l6 ?2 ]+ F
⑤ 方差
& x+ a, r6 O+ Q& D( z, y⑥ 标准差
( n2 V% a+ O' P$ f! j7 f$ o( R用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 . S" u. o3 ~) B- E5 m. K, d
5 S2 x7 Q$ R) p6 [
追加用excel 做频率统计
5 u, m( R3 G z2 i) k8 g$ x: d4 r) j1 W2 W
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html! N- _2 m5 ?5 ^2 ]% }
9 S- d( e3 w& n) p(3)相关分析(点二列相关 )" i; p2 k) _0 s
, Z- Z F" g7 Q
) b' q0 t, I- `2 e$ d
8 K. J0 f' z4 w, P8 ~
. c9 J, D/ O l. N8 e: K [% L% `
(4)回归分析
2 c# U! j6 E$ @& q0 z7 K, U5 |# d, z6 {+ K
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。4 g0 y, v5 [$ P" T3 m
0 N E% M6 w' |- @, c- x2 ?) C) H
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。; }; Z+ i3 E7 k/ U$ _
7 p5 @. h# a; q9 p8 z" g; R- e' l, `
回归分析一般有这几个操作: 9 ~' J# V) ?2 w5 J- q, x
① 设置筛选条件,刷选数据集 valid
: Q$ E4 }: e- V9 B9 ]/ z9 R2 |( g8 [6 k* p$ L* e
1 M: }* @$ z8 C% r( X7 T/ B* R
) E" Y( V! s8 D9 M0 B% D) U/ ?1 _② 模型拟合度检验
9 ~) j) k- k& k4 N; O+ z' Y ^
4 d, [5 {0 S& O+ H; H/ s0 W# G; k2 _
; W1 Q+ a1 Q+ c
③ 预测的模型参数
8 W( l- d& G7 N+ I: ?, I8 R3 `
s- `" [" l# Z0 {④ 预测结果,准确率
& H3 t) Z/ D! z1 U7 w- Z: |5 H( C: I. A: A$ y
6 J/ } l$ K% [. a+ w
" O: c7 ~; M7 V8 h" s- K: }# S, _' F
(5)特征选择和数据预处理, S. W$ P! ?: W4 Y, D
5 r4 h( M, a# X2 K特征选择,主要是gzh的想法
' m& [4 l4 O! N, r d+ C6 [" Q特征筛选的思路:
$ C1 G% ~% k$ j$ e) X. {分类变量用1 2 3 4 离散值 0 ]/ i5 q9 V Z \9 a7 U0 _; D
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
# T0 j! q% |+ M2 h对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
) n1 O# }! S3 B, z) Y3 V
5 i" s" u/ n8 W; _注意了:
c0 i+ \5 U' s/ Y: }& }9 M筛选特征的时候,重复性要考虑、缺失值要考虑. G! O7 T/ n5 Z; U$ `
: j! \ q* S* s- ](6)缺失值的填充
A/ k, g. K L; U) d! P" s+ m
' o# u7 W: }9 I X& M; [4 s' \
' G$ o& Q$ d# q v- G, ~ ^4 J4 @/ g! x! r
(7)文档编辑的一些技巧
, q8 O% K9 @; d" G2 q% [) J: j! S8 t3 T- Y. U) f
https://blog.csdn.net/qq_26769591/article/details/80848841# ~, a7 a1 g- M; A+ b" v5 f: O/ i
7 r; C. w! \# ~' A; w; s) t2 M, F4 Q(8)团队合作的一些心得
2 ?$ P$ H2 z) K L( E' W" o
8 P3 F6 X( }4 i0 p& N+ q: S, E: G; y1 E1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 8 X+ S. a2 ^( P6 Y' W
2.不会乱 不会重复做功 不会丢失工作
: E: S+ @/ O' Z( ~3.经验丰富 总能拿出一种解决方案 : g% U2 u9 s. r' i. z# O1 V
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 ! {: A, M4 s4 h0 b! H& M+ x( v
5.大致方向总是不差 错也只是参数不是思路 不是算法 ! T5 R; v" ^7 H& B9 g
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 1 D( a A+ Q& N# H8 O/ ?. F/ k
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线: z. s" M7 j7 m: O5 f2 s7 y# G+ w
---------------------
* y5 }) ~2 E4 T! w' H+ E# m' H
% @# d% N9 ]( U7 V, f
2 I* d1 R. T' J; ` W' `& Y5 z& _
|
zan
|