- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564676 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174626
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
数学建模大作业中涉及到的知识点总结:
/ Q* r ~8 T: T( j0 Q
! H+ j6 I; y& W(1)写作缘由, |* I% P8 u' ? E) U2 u- l
(2)统计描述:6 Q2 @! l9 k' X2 U1 H; E
追加用excel 做频率统计
- l# c" Y- K; Q5 O3 B, Y! v(3)相关分析(点二列相关 )
/ P9 E/ k* @% e" B(4)回归分析3 \) z& d9 M2 F7 }' U7 v4 y
(5)特征选择和数据预处理
) g0 \; R0 d1 \(6)缺失值的填充
- Y# C/ }1 ]6 x5 ~% ^8 {(7)文档编辑的一些技巧3 N3 P" s6 I3 H# E3 h$ Z' b" I
(8)团队合作的一些心得
- e I) X+ D3 z F! u z* J(1)写作缘由. c: ^) v! _/ d) b4 y5 s) [4 `
/ t1 V/ P5 d) f+ E/ v
在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
. e* r( G$ s5 {
! ?$ k }) ]9 d7 D(2)统计描述:1 ]8 O9 j( r! G' e
( C ]" \; H/ y/ K+ R9 F0 A
① 频率统计 - V' D2 ], @1 c/ W3 p. Y
② 中位数 * A3 t. I: O. Z, N8 S
③ 众数 7 R7 K B4 `$ G4 R6 e0 @6 i& R
④ 平均数 8 S% Y; B$ G1 e) Y. W! r2 x2 |" ?
⑤ 方差 : I7 B9 Q4 `& b7 O/ l
⑥ 标准差 # b- t7 S$ a% U
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
: u2 o* {1 P% w: E" `
, \3 d4 H0 }' t8 F. g追加用excel 做频率统计
9 t3 a W4 b) x, \
# q5 V; @ c! l+ ahttps://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html* X% M) ^" C8 x/ O" Z1 x3 [
4 f; ]9 a4 V; K) V% V! A; P/ [(3)相关分析(点二列相关 )
3 Z' }/ @3 b3 L& q6 |6 z# ~# m0 x" G0 [& ~3 L; P
4 p7 p4 ?2 [; d \% L0 H/ `; x2 U% V; k3 ^# k7 w
' a3 c3 C- y5 |/ Y# x, w
5 F2 G3 t4 I6 J' O! c
(4)回归分析* L. K" U5 j/ f' b4 M3 m4 i4 x
/ d$ G- q$ R. C% d
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
: J0 G4 u: d& }: u+ |0 u; T& n# o; J3 @! b- z6 a
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。* o( @7 b9 w4 H$ D6 q, ?
c% K; J4 H; D8 b" F
回归分析一般有这几个操作:
! b" t/ X ^2 o) g" w7 x! k. e$ e① 设置筛选条件,刷选数据集 valid
, ]! X( y$ w; \) V9 k5 p7 u$ N, T' j7 N
& n1 b3 p! S9 l5 \6 u: d
& y9 }1 ^+ D1 n+ M* C5 r② 模型拟合度检验
) Y4 k9 d8 `% k2 w; F, N9 A) }. ]: s5 O7 S
* b# m# r1 `' o2 ]
# O. w. _0 S" F7 a* b1 }③ 预测的模型参数
% g! [" W' Y" ~; K3 V# d- {$ I/ s/ N$ ~- ]1 U/ n
④ 预测结果,准确率
! m) \8 S8 K& Z! P9 {' u( q' k' a1 k/ y) v
% C# ?! }* o( X1 B- g* B/ d1 o
4 i* G! ^5 n4 e- {+ j" d& t9 ]4 @- `; u0 E( h
(5)特征选择和数据预处理8 \9 z: E$ J! J/ y
1 \; C" \7 P" y6 p+ C特征选择,主要是gzh的想法
8 y$ Q0 o9 ^9 C特征筛选的思路: ; j6 M8 [* t( [+ z, b
分类变量用1 2 3 4 离散值 $ y" K/ F: d3 e* C* V" F/ `
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 & p2 o, H7 {3 D( a& n6 B' p
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
7 _ ?7 U0 g2 i% R. O B" h$ j$ l9 d, x9 h
注意了:
, S0 G/ l8 @* H) {% H2 [筛选特征的时候,重复性要考虑、缺失值要考虑
x1 f% B! r6 w4 `, e. F" w# C/ a/ a( B$ X4 J X; T
(6)缺失值的填充2 |( J) {. y0 X, Q# P4 l* Y
" ~2 C2 @9 B: _0 [" b" W9 F) V, P: D1 i V' h: d# f& i# w2 |4 Z
4 m# i c. z. v1 |
(7)文档编辑的一些技巧: L+ \0 N! Q2 E0 U: \1 ?
$ _ C) k4 \6 |* H% n% y C K8 q
https://blog.csdn.net/qq_26769591/article/details/80848841
: I$ i3 O9 |0 A/ c" U# ?) w( ]; L5 y6 g, q; ]" X/ W
(8)团队合作的一些心得3 {% x* R1 U! l* o$ m
& D4 c: l1 |8 P; k
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 * P6 Z6 F5 J1 U$ J% ]9 M" A
2.不会乱 不会重复做功 不会丢失工作 5 I# ?" n' p; U3 R
3.经验丰富 总能拿出一种解决方案 , u+ M1 ^* Y6 A
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近 ; K8 ]* F4 N: T8 Y0 A
5.大致方向总是不差 错也只是参数不是思路 不是算法 7 k; P. {( V; F, z: k- q
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
* {" R+ o7 a! r7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线' `4 G" a6 r& @# N+ `
---------------------
, G6 P1 k! Z; O3 |9 H! S8 S
* I9 J5 w7 ?0 P8 ]' \/ z) o$ @! H5 Q# q# p
2 T; R$ r) _, S0 e, F6 m% L6 p |
zan
|