- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563298 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174212
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结; `9 ]+ Z$ h( ~% M( d( {4 V2 C
数学建模大作业中涉及到的知识点总结:7 s7 W; c7 Q2 t4 k( p6 B: u
1 @, P# z9 ]) Q* X% z9 ~
(1)写作缘由
3 ^! J6 w* r1 Y3 S' i2 D(2)统计描述:8 ]9 p7 Z$ n8 ~4 a) Q/ u! _! |
追加用excel 做频率统计
4 o9 j0 ~2 {* Q. a/ [- r6 m6 i, C: m(3)相关分析(点二列相关 )
: I- @$ b: C+ A7 O0 T1 n( d2 E(4)回归分析8 I. ^3 b9 g/ V7 q4 N
(5)特征选择和数据预处理
) S) P" J4 C) x4 C! M" B6 G! V(6)缺失值的填充
) c( m* P, D2 [(7)文档编辑的一些技巧. o' [, F1 A9 b
(8)团队合作的一些心得
; P# \& {/ E4 @6 @( [6 _(1)写作缘由
' _# U5 r9 V) R) [5 D; u' i7 N( a
9 S$ j, g+ X* D% U9 k7 F+ P, C, J在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下# q% d+ Z; D6 G4 z/ g) ?+ e
: G9 H7 J' U+ @) \6 _; `(2)统计描述:
( ] t0 n+ m9 b% j; f8 |1 v% W9 L8 e' K
① 频率统计 + ^6 O& E/ Z8 U e7 ^3 I% p8 K H- l
② 中位数 ) l( Q& Q& {9 s
③ 众数 6 }/ { B& r9 P9 A( ?4 i0 f2 p
④ 平均数 & L5 K# t( H7 x y
⑤ 方差 ( r3 M# ?2 \; D, f0 t
⑥ 标准差
# X7 t6 W4 w' ~3 H; H3 T8 K- Z$ Y用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 $ Y8 u0 q' N7 O! n, h1 ^
0 `; Y0 m9 q* A6 w- m
# F9 }3 D( |' g. e
追加用excel 做频率统计
3 c4 B: G; L6 x$ U* r 9 z, Q- V$ r1 E Y, O ?3 t+ J0 |# [
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html$ _* o7 L( b9 Y9 X0 F0 @- k
* _. {; }- u* O5 E& f3 M4 P(3)相关分析(点二列相关 ) |: f# M; c1 }/ e' x) c
6 y/ c" H: p) l. P7 ?5 K
6 v. b+ t& N3 g/ l
![]()
4 ~$ b$ d' }5 c+ n p4 Y" @7 M8 d" ]5 @! E- ^ C5 T/ \
* x5 t/ y8 @( J$ z& j
(4)回归分析
4 v. }2 B0 s, P8 @
, f7 I( g0 a' X: cLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。! i% }& k; }; Z) a' u% u5 {
# ^3 Y c1 V2 L2 [5 k {" Y
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
4 V V. N! L4 e- F
1 Z! P! t+ M |5 Q. ]回归分析一般有这几个操作:
+ A2 X. A; ]/ s! A4 x① 设置筛选条件,刷选数据集 valid
) K- K( r. b6 @9 b; g+ E![]()
1 ?$ T4 x8 m/ B) F8 \9 P7 X
, W% z2 A' @; V 5 ~9 p5 O/ k" z ?- L1 X) t
② 模型拟合度检验 3 I9 f: B+ C. h/ D- d( V
r1 K+ q. P: r% a. i# z
) C6 O- U9 J% V, t
+ W+ Z/ g4 @9 a; T2 D5 ?. b9 }
③ 预测的模型参数
$ q" w3 F- W% b' u# ]' H ![]()
9 v3 y! ~/ Z2 o# @! R# U+ U* F④ 预测结果,准确率
: Y# H3 C v6 a/ h , [7 ]4 k! K( P, l1 ]
![]()
0 g; t7 N; I, \7 E# u8 L! U$ t/ E: ?9 |9 c
/ j- ?4 {7 C. R0 \(5)特征选择和数据预处理
! d/ G$ e [& m8 S6 }
0 P A0 R3 P) |特征选择,主要是gzh的想法 1 V4 [! g+ r1 ^+ F" [
特征筛选的思路:
2 w8 H! L* i9 `/ Q& I+ |分类变量用1 2 3 4 离散值
4 k4 h( E+ V+ [& ^6 G对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 1 x6 I# m" }. j
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值$ o0 _* m2 Y8 T2 P( Z1 ^4 t+ i
8 n! C7 E5 x; x8 F5 J- u( P! d- i7 D注意了:
; P% U& m5 j1 ]- i2 f' y筛选特征的时候,重复性要考虑、缺失值要考虑" ~% |9 g5 C% U5 @/ x
7 H( m: _# H3 U- G2 }' V(6)缺失值的填充3 O* p1 Y# Y& t+ A% j" u! k0 z
& b' [8 r% p S9 E![]()
4 q* N% {, H8 v# Y. k+ Y) F9 K& z: w
; C. C) a: X/ h D' B( Q(7)文档编辑的一些技巧
5 M8 f# t& n/ J8 p$ W9 Z
$ T) I' A1 a, O( g! khttps://blog.csdn.net/qq_26769591/article/details/808488416 b' P8 L; W5 t$ q. g3 v$ V
- W- V6 {1 `7 v
(8)团队合作的一些心得
0 [' K+ i [1 ~9 k% V4 w7 w s- |+ T7 S! E+ u/ v
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 ( X" n. H+ a* @+ u% r
2.不会乱 不会重复做功 不会丢失工作
! p6 K) ?% d# I; ?) A3 u3.经验丰富 总能拿出一种解决方案
: o( ]. S' G, |3 E) X4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 9 l, h8 B- Q, K
5.大致方向总是不差 错也只是参数不是思路 不是算法
% n7 A+ x9 ]; T8 U5 e" [7 d6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
$ S* `/ m' n: O4 N* q4 q- v+ D! v7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
3 ~5 T1 ^4 G/ x( D& N1 K--------------------- 0 R6 K9 F9 x% _! n+ s) n
作者:-英击长空- ; b. ^ M- w3 M3 [, ?. e
来源:CSDN
. u9 m% P/ r$ }, s% @" m原文:https://blog.csdn.net/qq_26769591/article/details/80840673
7 i: f! P' v7 z3 W% R; r3 T9 Q/ S( Q. j, y2 ]3 x
3 y5 i; W: J% y8 A( G- C0 z6 a- [5 w6 T$ j& v9 C
5 h3 c& T7 X7 u7 N4 `9 U! N) B' _
|
zan
|