- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563300 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174213
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结+ F6 I% Z( H9 m9 k4 a# i& H& ?, L
数学建模大作业中涉及到的知识点总结:
5 b/ Q" g) r! V6 v, d( I6 e+ `/ Z h A3 j7 n5 X Q+ u8 P
(1)写作缘由
3 b. c; s: L" l5 y' J2 g$ ?(2)统计描述:6 W! z2 C w$ u7 f" V
追加用excel 做频率统计+ J* Q9 v! y8 C. f5 R4 ?
(3)相关分析(点二列相关 )
$ M: m. F" @7 T* S% W5 X(4)回归分析
! Y6 R* D) d4 w: M" U4 H(5)特征选择和数据预处理1 M6 H0 ~8 z2 o z# {$ U( L3 r
(6)缺失值的填充
$ i% q+ P! c* E) B6 M(7)文档编辑的一些技巧
) M7 ?9 }' n: t) J(8)团队合作的一些心得* e+ X0 j" m) J0 k# p# \( }
(1)写作缘由% m: b3 V- l4 {, G# l
7 U; R/ r2 r( Z: ^) w+ j! x \在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下: n$ i) e' t2 k( g I) \/ _
9 c5 h1 T" n( {- n3 ^( w6 G(2)统计描述:
+ } ?& s* |9 X, p$ ~3 Y, `7 T" G r1 N" [' O
① 频率统计
- U+ T0 c1 \: f7 a* I; v+ \② 中位数 % l8 f# t' l3 r6 X4 ]
③ 众数
1 U# n; U: n+ V④ 平均数 . h1 H# W- j+ r0 n
⑤ 方差
4 B) z. A( o6 v ?3 P⑥ 标准差
' N+ g: W, Z6 {% x4 z$ |7 L! l6 q+ v用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
5 a0 J4 l2 x* ` [8 g. K6 \1 \8 I: p
: P, _+ ?/ D. c0 O! i
# F, N! z+ r+ h$ E L* q9 B2 P追加用excel 做频率统计
" b7 ^/ Q: o6 p( a8 S4 e![]()
9 L! F2 L; |8 W; p" L/ ~7 ]* d( Khttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
, G& V Y1 o0 H# `% l' h
( J- c8 V1 y, N(3)相关分析(点二列相关 )7 E# {) X# _; e2 e: H1 @. W
![]()
5 z) d* D7 {: c+ `# a. @2 O' _
* U* W' x. P) r4 y ' C; h" k' R/ L* B
. i1 [7 a& a% r* N" K% ]- ?! u) l- a3 s
* }3 x* u3 ]6 u# h& B8 Z% k& f
(4)回归分析
9 j* A- G; f7 e4 U
1 d( _* L- e. ULogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。2 Z4 z/ o( p9 m' y
* ?1 K! Z1 o$ ^3 _因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。8 l: i$ k6 f8 k3 X6 k
1 _! {6 Z4 [6 r. ^- S3 |回归分析一般有这几个操作: 2 U& F: W- m# {! |+ s$ Q0 ?1 ^
① 设置筛选条件,刷选数据集 valid
( I' Q1 r! C$ D4 o0 V4 U: a. @ 0 q: R2 S9 ]- J: C* ^7 p
0 ^8 b, ]# R! o" |: s
$ _" K2 I2 I1 K7 `- Z- g" t
② 模型拟合度检验
7 h+ H+ U, A8 L& @+ N# Q ) ]: C' L% Z, ?1 U0 Z" Q
![]()
# K. n0 m" w: \: G. a- W/ Q, e' c4 g/ Y$ ?$ D, g. H
③ 预测的模型参数 ! Z! |# }6 z! ^+ r% `
![]()
/ ]# k; m8 X4 w$ Y& E. k4 O④ 预测结果,准确率
9 r9 P. K( h& u; X$ Y7 `![]()
& m ~+ w! b- V6 j6 O - e+ h: o5 C1 K9 C* K8 l
" R% d& n+ S4 g& y5 m1 U$ o% [
5 u* E Y4 q- s4 ?, z, n
(5)特征选择和数据预处理
% T& l! m% c7 ^4 A* n4 B+ o' L5 X: J6 f; L1 v0 S, E! Z9 N, j
特征选择,主要是gzh的想法 % ?9 `0 h7 i5 G! h, @4 Z
特征筛选的思路:
7 r: E7 {" z# @" _8 z. f分类变量用1 2 3 4 离散值 7 l; E9 Q$ N6 p" P2 a" E& {- ^
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 5 S! P% A9 J' u0 Z, x4 T8 @
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
* s% ?& k4 a8 p5 x r+ Q+ @6 F' G0 s! M9 N0 P% s) V0 p* k
注意了:
! g3 M" q F6 t筛选特征的时候,重复性要考虑、缺失值要考虑" `! e6 `" \0 m8 w
8 {9 u' e" E. h( B(6)缺失值的填充: v0 ?1 E: u# k3 e
" H& X8 w2 z6 R5 V4 V5 q![]()
4 t0 a1 v1 s( ~" x7 U) b; p) a. B
0 {9 b# Y8 O+ W& {6 Y% g(7)文档编辑的一些技巧0 G5 u1 v: l8 t5 {& [( ^- k
* f1 M4 c/ d7 p& N* ^https://blog.csdn.net/qq_26769591/article/details/80848841% C5 f8 I3 |% Z) [- S
! d3 |8 Q3 ], h" S5 Q(8)团队合作的一些心得
" c; r& T/ L1 ?
' k# m) R5 C& K: n1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 $ [9 T6 K f7 e6 R
2.不会乱 不会重复做功 不会丢失工作 # q9 D( R4 p+ f- C; y
3.经验丰富 总能拿出一种解决方案 { ^9 v/ @( ~! z& s5 k8 X- S4 n
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
+ R# i3 E7 Z, F5.大致方向总是不差 错也只是参数不是思路 不是算法 9 A- t9 g9 M. n/ _2 h' r8 C: Y; u
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 $ ~$ e8 W+ e3 G3 r4 E
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线3 l, {$ s$ K) e# w8 H) d. ~9 k1 |# R
---------------------
+ b8 Y- Z: i9 f- {! \作者:-英击长空- 2 M& e0 g3 z, m& P" f
来源:CSDN 3 Y o; \) {0 [: N
原文:https://blog.csdn.net/qq_26769591/article/details/80840673
& k2 `9 _( u- P5 d n( Y- O r
# q. O" S; U* r9 n! f+ W( J) F& A* o) p7 s' m) N# Y- T
: X/ U9 x$ x0 W0 a9 Q
- d; w! }. S1 n* y' r
|
zan
|