- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564705 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174634
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结: 3 g) S1 c8 R& \' ~9 I$ l
- x9 w! Y3 `0 x: g& B% v6 X
(1)写作缘由 k0 r3 t1 A% J% p% _
(2)统计描述:
2 _% N4 O5 H9 w+ e' d追加用excel 做频率统计
4 ?: p* a9 V# U3 B+ u# @# E(3)相关分析(点二列相关 )+ e" @! d( U) p, @
(4)回归分析
8 f5 V: g, f+ l/ ?8 ?# q: H* _(5)特征选择和数据预处理# ~8 C4 b4 ~8 h& O
(6)缺失值的填充- S* Q, G, s. |/ O; _. R
(7)文档编辑的一些技巧0 f& {+ V7 o# i
(8)团队合作的一些心得( y t1 L$ p5 D( ]% _1 A- P
(1)写作缘由
, a+ Y$ g+ z* J, J
. }1 r! V; B# o. w8 S在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
2 C! u# ]; j1 L. w' c# r$ N0 B, s5 [ Z( I+ H9 ?8 B! M
(2)统计描述:
?0 }7 T% D! b6 L7 C% j; \3 X5 ^# q! l6 r
① 频率统计
8 m I7 r7 M* Q7 N2 x* I& o② 中位数 5 c% Z$ U0 ?' E8 b; {
③ 众数 ' X9 _9 y4 p+ A; U% n; Z9 n
④ 平均数 % Q# r6 A" X: L7 w
⑤ 方差 " v! H! T- U5 O, t& @6 `, x* N
⑥ 标准差 ; ^6 M& G5 f, K# M9 E4 v
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可 ! L& o; \& B7 p. s6 j! T
" X& r5 G- N& s y9 Q) I追加用excel 做频率统计: y/ b2 J$ t. z. y4 x& e+ `
" J$ `8 @1 P) v0 j. w2 j
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
7 N0 [' N' f2 o5 ]; N! |$ S# U w6 d1 j# {. e' ^ c
(3)相关分析(点二列相关 )( {1 e4 ?' n/ Q+ N; P8 _
) {! @ Z4 @7 E' o
5 h# l$ z2 \* k, n A) D
: \0 Y E# s4 j5 V+ u# Y7 B3 g$ R3 j4 U. x r
' g9 ?$ q8 s9 d: M
(4)回归分析
' ~- ?4 X4 r! c$ \' Q H. F
. [" _: e( h. [1 XLogistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。+ Y" \( A& E6 I9 L7 ~7 z
; E- l n5 C7 ~) j
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。8 @2 C# t/ t( Q) j
2 W7 r) d9 d0 f9 \: u$ B
回归分析一般有这几个操作:
6 D5 M S6 [! h* x3 X① 设置筛选条件,刷选数据集 valid - b8 ~/ \2 m9 |- | k, V7 _! k
7 j. s* I3 `% a" c ^' u0 R# D) j0 }/ K5 F
% K; X6 F) O7 a9 G) q4 {
② 模型拟合度检验
/ `4 {! @0 u# [5 n S: m! [; X9 C; d7 N' ~! F$ T" d
/ Z1 s+ g- b1 D' x/ _4 i" e/ Y( N; _; }: K* L- e$ l0 i
③ 预测的模型参数
5 Q0 w; o* L" v" E# t3 V. d# J. B% b1 N" D. I* e0 `0 g7 m
④ 预测结果,准确率
G+ O$ R, c4 O6 P6 e# W: i
2 D4 n! s% w: A; i0 Q. S* e6 y M0 p2 ^/ \
9 F: V+ H' B* D7 f
' s2 Y% H8 W8 d( y. T# s7 _: m(5)特征选择和数据预处理9 E% z1 o/ V- R
' V% D) p1 ?, L6 i; k特征选择,主要是gzh的想法
) f- i2 X; |. n5 `: W e1 K特征筛选的思路:
& Z9 w7 J# _6 ]- H分类变量用1 2 3 4 离散值
1 g' [6 O2 `# h! |对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 6 [3 `" t9 x& Z% C
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值. p d/ w4 e5 S* M$ t7 l/ h
. R1 K @& Z) q ~/ D+ q G
注意了:
; r7 V0 E; @7 H8 K: h筛选特征的时候,重复性要考虑、缺失值要考虑
$ Y0 O7 ^, z4 R, @0 t, w; }7 d& L0 {/ n) n- ^0 p
(6)缺失值的填充
. M4 z3 d3 C& @9 ^' |" P0 F6 }5 ]2 D. }# |! o5 `
/ i) n! ?! u* J! \- a
5 z$ @6 A9 d, q, r(7)文档编辑的一些技巧
& x) r6 P7 n" F
7 \1 ~. e. X7 c/ @/ Qhttps://blog.csdn.net/qq_26769591/article/details/80848841
6 C0 x2 R. D6 G) F N2 y' P" j% F. T& G. ~5 K5 j$ C
(8)团队合作的一些心得* p r& O9 r6 }" C. T+ Y
. Q* i' |* @. q0 T
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
$ `% \0 |; N$ t+ E5 ?2.不会乱 不会重复做功 不会丢失工作
$ C+ r" z5 a/ Z8 A3 D; e3 x3.经验丰富 总能拿出一种解决方案 _4 u" M" m4 N
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 4 |0 O' j6 K. r! c5 S# C
5.大致方向总是不差 错也只是参数不是思路 不是算法 " ^& Q P3 v% |* }2 C
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的 - r! M1 H8 E! U
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
! w7 H: [* ~9 K7 }---------------------
_, f8 d$ ^! N9 z, W4 j" y
1 v* t- ^/ i1 r9 E; b, a: }0 V& `/ ~3 i+ v' E6 i* g/ B
7 r9 }. H; H! N! l4 D' b5 D8 i
|
zan
|