- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 555928 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172151
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结' K5 Y( A2 u+ J x& d
数学建模大作业中涉及到的知识点总结:
- w; M* `8 n8 U/ o0 v5 D8 H' J. R4 U, E' ?5 d! U# @' v- u$ ~
(1)写作缘由
4 I/ P5 E# j7 ^' P(2)统计描述:
6 M& u3 w) a6 C+ H% S% Q7 l; A* t追加用excel 做频率统计
/ ], B/ p: I$ |) N, R(3)相关分析(点二列相关 )( d) o5 I j& v+ E5 A$ v( X
(4)回归分析. |* i/ ]9 ^" I! y
(5)特征选择和数据预处理
- y$ `7 w' ` _; h6 X* @(6)缺失值的填充3 p# W3 T7 C' Z1 L# ?2 F) l
(7)文档编辑的一些技巧5 _; A* Y$ m* Z; @# `8 S% u
(8)团队合作的一些心得
7 ]" D$ S7 a, L(1)写作缘由
! g. S. W2 b# U' _/ K7 t4 b5 ^, `& a( X! J6 y3 }7 }9 A
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下/ |; j) I) X8 p& B/ [+ l% |
7 f2 O) Z+ d! q; d3 g4 V( C
(2)统计描述:3 j- A u2 q8 S) V4 n& ^" P' r' T& n
& G4 y# a4 Y' l/ S( E
① 频率统计 0 ]5 c/ V/ J! Y( A0 \. ^
② 中位数
5 n7 L! m. q. M③ 众数
; e2 R, i ]4 j$ _" u8 J④ 平均数 4 h" o4 e1 ]. Z! @ m) D1 a) _( R
⑤ 方差 & |* H% A5 X; S) I: d$ q
⑥ 标准差
! N3 K3 y8 C% ]/ z2 H: g用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
6 j! x: ~$ w7 _' P0 W7 U' _: k% s0 N
7 N$ P" J% p4 s1 Z! j3 k1 v追加用excel 做频率统计7 y; a8 T8 s: K2 j U1 Z# G) \
![]()
* G! @' x8 J: P0 J7 V/ C$ ~" [https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html5 P4 U, {$ ~1 }" j7 i( W
% y5 H% v2 d" w9 }6 Y" l Y(3)相关分析(点二列相关 )' U0 L! \$ N" h4 t
![]()
2 G1 n8 Y* Y& l! g9 k# ^
z C' j# M* n S![]()
! I9 d+ Q6 D0 E3 v. e5 y! C- u6 D J2 _$ _" O
* t# C+ M) J0 L' K(4)回归分析
6 w3 S, S/ {# W& K( Q G% R# j: M0 A* {# o
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。! q! n" z5 g, {" Z
5 S; S; J/ a" O因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。6 V5 Y$ A+ ~) Q/ M
8 p' Z4 f0 q9 {. b, Y
回归分析一般有这几个操作: - w$ X$ ?9 U" n6 r
① 设置筛选条件,刷选数据集 valid
( X, S5 F9 b1 e; P![]()
: j; Q( \, @& t0 K/ \7 U) l1 r" t
; Y9 s9 K! ] N' O+ W% R " b% f) v0 q6 }
② 模型拟合度检验
% P& ]: y$ J2 J9 J4 M2 { ( `: Y0 d: \4 h3 e& O# |4 k3 L8 \0 c
![]()
" B2 E I F0 s" F3 E8 S* Z6 G% ~$ J K; @ W. G: m! D
③ 预测的模型参数
7 A. m" G+ k. l9 @7 f |/ g! D ![]()
P6 a3 s, G* v* e9 P' B④ 预测结果,准确率
- O0 x4 ?% ?. [1 w" j, k" k![]()
* e' S$ @& Q+ _4 n: z f ![]()
; }1 I, a$ F6 v! }& n. V
7 U' c7 k# l, ?- ]- l, `3 H* n) ^7 [' g* m" ^( ?
(5)特征选择和数据预处理8 _9 S9 X1 L. D s* l- |9 C# [& x, ^
* v. { I+ x; f: a/ ]
特征选择,主要是gzh的想法 4 E& U! @8 `$ F- d& k' B- F i
特征筛选的思路:
i, a8 l5 G$ j2 G( s( b* W$ h8 Q分类变量用1 2 3 4 离散值 2 ` u0 Y% t2 d/ ]
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
L2 W" b9 Q8 a1 e对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值' p8 Z4 y3 m& c# k( |/ B
) _9 b! ^8 V; N+ n" |) _# D
注意了: ! u" T1 @2 H' P% Z
筛选特征的时候,重复性要考虑、缺失值要考虑+ s* f- `7 k& B- ?2 A7 Q
/ l6 z7 L3 P, z- [1 d% c
(6)缺失值的填充" i7 v t) e' p; @8 V
7 ~3 d6 R: \( u![]()
4 E. Y/ P, T. Z" J# {" B
: K8 N! P3 M: K5 M" w5 A. o% X" A(7)文档编辑的一些技巧& Q8 [2 m# U' K
0 E7 Y2 h( N) H+ ?' d( khttps://blog.csdn.net/qq_26769591/article/details/80848841
/ Y' x+ T+ |5 R
/ M( c4 v' L( G2 z5 G# X. B(8)团队合作的一些心得8 C( [ V+ C6 @ I8 z, e
( ]$ t. l' n& H. x% |2 T5 N' L
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
* B- P! b& d. J* j- j2.不会乱 不会重复做功 不会丢失工作
: q( E1 t+ E4 B7 J5 @+ i3.经验丰富 总能拿出一种解决方案
. I- [# Y8 [$ T4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
3 o% A$ ^% x. G" T( r3 e: K5.大致方向总是不差 错也只是参数不是思路 不是算法 8 r m( O( }+ _
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
7 P% x1 n6 j4 R4 A8 i7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线& L* R& S+ G$ x4 `
--------------------- 7 l4 p2 k9 ]7 }; X0 K
作者:-英击长空- 5 e1 J- N- _) u1 F
来源:CSDN
% h' s: S( z. U. G7 `7 K& n原文:https://blog.csdn.net/qq_26769591/article/details/80840673
% S; N8 I% o3 u9 r
3 W& @* X0 g, b3 z6 k5 ?
+ y( f9 b, u1 T! T$ d2 \5 J8 R) z$ N" O. ^2 B
0 S' n$ W& a1 T1 B o$ p |
zan
|