- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564095 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174451
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数学建模大作业中涉及到的知识点总结3 }/ f( \5 Z. C$ @6 Q+ [& ^
数学建模大作业中涉及到的知识点总结:
( f2 a5 l4 E" P9 E
: r [, l2 c1 S3 _' a(1)写作缘由' z2 p3 E- W! t* h* l3 P
(2)统计描述:
; J* u) d7 ]; j追加用excel 做频率统计# V# g( g2 {* i/ X2 `$ \4 s' T
(3)相关分析(点二列相关 )
% n: E X1 n/ B @7 S- `(4)回归分析
5 |. z" s4 J5 N8 I& G* u1 e; O(5)特征选择和数据预处理
; }2 S% ^4 Y# [5 d: _1 N( J(6)缺失值的填充5 ]( y J& y. a: m6 V) X! C
(7)文档编辑的一些技巧
9 s4 g/ r8 f$ [: {(8)团队合作的一些心得8 ]) y6 h* c9 ], U; ^2 Q
(1)写作缘由, c& I/ {7 k/ H& m. w7 j
" e7 ^% S7 h: `. L# e, j" W在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下
6 f% ^5 V' A- z: s& `0 c) }2 w! o' Z3 d' r0 b7 u
(2)统计描述:. @$ m' L* p U: q
2 v8 r. {- b: `1 n
① 频率统计
2 U, j" ~+ H4 j' @& O: m7 n② 中位数
0 o" n9 i3 D5 L& [/ Z③ 众数
% s6 |, Y+ o7 {④ 平均数
- |9 r6 \0 h( s) ~2 U" a⑤ 方差
0 f0 b1 p$ X9 {9 ?⑥ 标准差 8 D1 U4 D2 I% N8 F- U3 x2 h D. {
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
) B: }% U9 T4 q3 H$ R3 \4 |/ j" Z' V/ ~" [$ |9 n' B
) X, ~' J* G6 e- E, z: b! @6 ]追加用excel 做频率统计
/ q6 f; X& C1 ? ], k: d, D5 @ - c$ n- f) B- \2 [- G" \+ Y' ]
https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html$ V; `" e9 y! K. w- T5 H7 i q' i' q
4 E/ ]' q0 j/ q3 \( Z# d
(3)相关分析(点二列相关 )
Q9 a& J& O; H, ~' w! u- p @![]()
) {4 P( z1 Z Y: I; h, k
- y6 N& P5 r+ T! V, U& y2 L 6 V0 X0 S p0 r- X U
& B/ \' R4 m2 X! K
8 _1 V* N, K M
(4)回归分析
+ ]0 N7 M8 c4 K6 C& `6 z6 c+ j( N% j- n1 {& i
Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
7 @$ V. `, V: I8 W6 i$ g
4 H, M* a2 e- e, Q9 G8 {因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。5 {3 h. ?! h/ T* [: a( E) M
! W+ [$ _% U, r- _. { \6 d
回归分析一般有这几个操作: " e# A0 _ }9 G9 \* n% v* L
① 设置筛选条件,刷选数据集 valid $ w' |& ]! [: x: w
![]()
2 s7 Q! `0 _4 S2 o9 X$ t" A9 L- W# ]0 f
![]()
. I! q2 s- f/ r( H. X2 Y6 a: T② 模型拟合度检验
, B* o$ @$ F2 O1 ^0 G9 | ![]()
C; l6 Q4 c' s9 ~7 g/ I: q) R: C2 D 9 |- i" d2 D U% x
, b5 H& a8 L+ B③ 预测的模型参数 2 L: o" u9 ^" n7 y
![]()
8 t- p A. O, ~) F$ ^1 p④ 预测结果,准确率
- U* [8 Z4 G3 ?0 N![]()
* v& _( S. F( a* _ ![]()
% T7 u: R4 B" I. I+ i; n8 f0 n! D; r$ [" H' T/ R3 X2 K
8 U3 U2 n3 T8 ], x
(5)特征选择和数据预处理
+ e" C. H' y% _' Z6 `8 A$ h# M& t$ J4 F* c- r" `) r* ^* X! ^
特征选择,主要是gzh的想法 / `! \- l5 ^& g" Q+ M, ~4 g. Z
特征筛选的思路: ! R ?' b9 i' s' }' u0 T7 y- ^1 \
分类变量用1 2 3 4 离散值 2 D. ]. y$ i3 G1 w
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值 v; _ g! S3 S4 G! d: p
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值
& K/ Y. B2 N, F7 s5 g: [
5 B9 I$ T# g- H8 F& }- `注意了: x, c) s7 P* \' n9 g4 D& d
筛选特征的时候,重复性要考虑、缺失值要考虑
8 j- ~- N7 y# i( S$ Q' I+ j
0 U! ^0 J; {0 j$ C+ \! f(6)缺失值的填充
, \! w s' [2 \) j$ w0 o. r7 V* U4 y: B5 y, e$ z
![]()
3 S! d& W" m- j1 `1 i1 K* k6 H5 Z) U3 U+ c6 F
(7)文档编辑的一些技巧: c1 T; i; }4 V# r
" Q# X! N9 D0 J) g* q! c2 a; {
https://blog.csdn.net/qq_26769591/article/details/80848841
( Z9 t7 A$ t% b, D8 k- X$ x' q
) f4 l3 |! g' n0 }9 N, G(8)团队合作的一些心得
; n5 G7 d% A9 [' m8 a6 P6 ^
* V0 ~, i; a, p# z$ K1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
' ]0 g6 a3 L0 r+ t c1 c2.不会乱 不会重复做功 不会丢失工作
- `* Z; G" \+ ~5 a- ~3.经验丰富 总能拿出一种解决方案 0 Y# @( n$ Z' I( d5 H) r
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能**近 0 K+ B2 R# s! Z% `6 B3 l
5.大致方向总是不差 错也只是参数不是思路 不是算法 8 }% w5 u4 ?+ C' y
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
6 S* n+ L% R. E7 q7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线
! u' j9 x" b, w---------------------
9 f- X! K% N2 G3 C& m作者:-英击长空-
( Q/ w6 l/ K; h4 G来源:CSDN
* j3 a7 E+ e' T! a& ]4 K0 u原文:https://blog.csdn.net/qq_26769591/article/details/80840673
. A7 M- @- |$ q. U
% j; G6 @" ~3 I
6 |, J0 A1 h C5 l% Q# ~2 Q' u
* @, K8 S) H |7 r+ y
0 `' U' l2 P; P U J. `% Z% S5 N' D |
zan
|