- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 561225 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 173740
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结# ?* K- m, e! x" y3 h: s; ^
数学建模大作业中涉及到的知识点总结:6 A1 U3 f* {3 L( `8 g
) H3 w; }1 b# p3 b# E B4 Z
(1)写作缘由, T+ x; M' A7 M' w& p% \
(2)统计描述:
7 a) W/ k; ?9 {9 i追加用excel 做频率统计" K) j! m/ Y2 I" U
(3)相关分析(点二列相关 )( N( S% {+ G2 r, ~0 }
(4)回归分析
' P& R0 L. T9 A7 Y- \5 O(5)特征选择和数据预处理
+ ?) |6 I4 Q" a9 X5 g(6)缺失值的填充+ S8 j# \" Q k; {8 F9 O
(7)文档编辑的一些技巧
+ T. c. E, E' A( L; w(8)团队合作的一些心得' m3 A% l) S2 L) {) e
(1)写作缘由- _" |( l: ~1 p, y, R3 H3 ]' M
) S$ V1 ?# R' K$ G" [在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下; y# j! m) w- @& M! c2 m
! s3 K+ V8 n: w H6 Z' V" S
(2)统计描述:
1 z0 Z! m' i$ L+ w! k* X- L5 B1 H# [* g3 I/ t
① 频率统计
8 Y! A; {5 x+ I& O② 中位数 : E# N* |7 E J$ U; V3 H0 G4 _
③ 众数 / B6 p) k' P }, V& D
④ 平均数
9 ?; x7 j; P6 s& b% i) i0 U$ e⑤ 方差
3 _* s3 {. O# K1 k3 r, z⑥ 标准差
. T1 f* Z0 V8 c: i6 ^3 C6 B用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
7 ~! a; D$ d! ]5 N4 D2 V& x0 A. v
1 D( v! x* H: k$ F" ?: G( j) i0 B4 b ^ `
追加用excel 做频率统计
4 ~6 t. y% \- ~* p! ]. y- `1 \+ J 0 O- L6 ?) g3 T; P: v
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html
2 t1 P/ k! _ c1 w
9 f) x1 h7 a) W ?8 I2 v R(3)相关分析(点二列相关 )
# S! e7 G. J; P; }! V* q![]()
. a7 L9 p& y! E3 Q/ ^$ q& k7 ^& C7 m/ n+ I( a
: D& G9 U# D2 B0 n( s
3 K# _ t" s4 ?" A8 D
! w |+ a% N5 u1 y
(4)回归分析
" _7 y1 h0 W" C: Q3 E; K; b6 y9 C8 F$ L1 j
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。# h4 W( e- P7 A& }* M3 T; q% h0 G
5 p8 ]/ \- S/ [5 I7 X2 u
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。
3 r# k* o$ ?, \0 Y1 L5 `, X
* H# u% M" H6 P6 R6 d( w/ ]回归分析一般有这几个操作:
( V" M E! W: B' B① 设置筛选条件,刷选数据集 valid
+ f6 L! x6 l, Z+ s9 f![]()
& |1 s: ?) h! k6 M5 ?9 w2 u
6 b% ?7 l5 v+ I2 S p5 q/ y8 y. I![]()
/ c- @8 j# _- g② 模型拟合度检验
. R/ G& s$ `' Z) y- R, F/ S 1 r5 U+ q, `* X/ h
& J* F% w2 ]( S( K0 v
* y T3 {3 `6 ?# v- U C, X③ 预测的模型参数
% k2 ?" S3 x3 Z; n3 [ 1 c1 A8 Z& k1 j& K; F2 T6 d2 Q! N/ `
④ 预测结果,准确率
+ k3 k F- v4 j/ Z; Y& @) c![]()
- R4 V3 K, a* U! A k! |$ F8 E ![]()
: O6 a- f1 B% A
) `" k" ]* I% E
1 m! {+ c5 a* _- m: e- `(5)特征选择和数据预处理
, \; X7 d; j n* L/ d/ y: c/ m7 O* u! h. @+ D# L6 l4 H
特征选择,主要是gzh的想法 ; } F6 {+ C9 W& ~+ F, x( S
特征筛选的思路: ; k/ g9 W7 q' ?$ d! y
分类变量用1 2 3 4 离散值 ; w# H4 T/ T% }+ r+ q
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
( P, Q- M% |" Z7 }对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
/ G( L, ]( q- |! m3 U0 {
2 Y$ ]: |, ~5 ?' r% W% I+ Y9 a3 x注意了: 1 }/ w' }! [9 o1 t% J
筛选特征的时候,重复性要考虑、缺失值要考虑 O4 I; T; C/ F
3 D* g$ w5 H M(6)缺失值的填充
d4 m7 z% X& `0 d; J
) b' I( \3 R/ ?7 X% j $ s2 ^. e* D, u% O W
$ o @* ?3 i, a7 y2 ~+ J# x, ?' H
(7)文档编辑的一些技巧8 N- B" S# ^& b/ t L
; E; e7 }* {# y6 uhttps://blog.csdn.net/qq_26769591/article/details/80848841
9 D1 E7 z, t9 x5 v7 i+ s8 P5 C: o* L5 U% u
(8)团队合作的一些心得$ v3 \$ e& X4 r
/ H1 b4 n% I( C+ }$ Q: \! o
1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题 - k8 n8 h7 O4 ~# S
2.不会乱 不会重复做功 不会丢失工作
/ D4 f! j9 f) N) D9 C3.经验丰富 总能拿出一种解决方案 7 I9 w$ i* ]% S0 J( H! e
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近
% h! \7 N& p5 {! h% s0 z5.大致方向总是不差 错也只是参数不是思路 不是算法 7 R; C+ k1 M5 V$ W; S+ Y8 v) j9 q6 {$ G1 D
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
% q$ F( J3 P* G- \7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线! M L* d; {: x! @/ V. [' M
--------------------- 4 O& z0 ]+ q7 k" i; g
作者:-英击长空-
" I- c# M& a2 H; }' C$ \: c来源:CSDN " L/ U6 C9 n$ _+ y) L/ K6 ?
原文:https://blog.csdn.net/qq_26769591/article/details/80840673 9 r9 p& Q7 E5 H S; G
+ K7 O( _* Z2 |5 V7 q
0 S+ Y; O6 K4 w* k( o
5 Y6 h7 \( ~+ b6 x, h( W. [
, Q5 Z1 y+ q, ?# P |
zan
|