查看: 1980|回复: 0

[建模教程] 数学建模大作业中涉及到的知识点总结

[复制链接]

字体大小: 正常放大

杨利霞

5273 主题	82 听众	17万积分

TA的每日心情

	开心 2021-8-11 17:59

签到天数: 17 天

[LV.4]偶尔看看III

网络挑战赛参赛者

自我介绍: 本人女，毕业于内蒙古科技大学，担任文职专业，毕业专业英语。

群组: 2018美赛大象算法课程

群组: 2018美赛护航培训课程

群组: 2019年数学中国站长建

群组: 2019年数据分析师课程

群组: 2018年大象老师国赛优

电梯直达

1^#

发表于 2019-6-5 11:24 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

数学建模大作业中涉及到的知识点总结：

（1）写作缘由
（2）统计描述：
追加用excel 做频率统计
（3）相关分析（点二列相关）
（4）回归分析
（5）特征选择和数据预处理
（6）缺失值的填充
（7）文档编辑的一些技巧
（8）团队合作的一些心得
（1）写作缘由

在数学模型与优化的大作业中，遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理，因此就稍微研究了下

（2）统计描述：

①　频率统计
②　中位数
③　众数
④　平均数
⑤　方差
⑥　标准差
用spss软件，可以很方便快捷，具体的spss可以随意参考一本spss的书籍即可

追加用excel 做频率统计

https://jingyan.baidu.com/article/219f4bf7f1eee4de442d383f.html

（3）相关分析（点二列相关）

（4）回归分析

Logistic回归主要用于因变量为分类变量（如疾病的缓解、不缓解，评比中的好、中、差等）的回归分析，自变量可以为分类变量，也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量，并可以给出预测公式用于预测。

因变量为二分类的称为二项logistic回归，因变量为多分类的称为多元logistic回归。

回归分析一般有这几个操作：
①　设置筛选条件，刷选数据集 valid

②　模型拟合度检验

③　预测的模型参数

④　预测结果，准确率

（5）特征选择和数据预处理

特征选择，主要是gzh的想法
特征筛选的思路：
分类变量用1 2 3 4 离散值
对于搜索记录的变量1：用含敏感词/搜索记录的比作为值连续值
对于搜索记录的变量2：用含敏感类/搜索记录的比作为值连续值

注意了：
筛选特征的时候，重复性要考虑、缺失值要考虑

（6）缺失值的填充

（7）文档编辑的一些技巧

https://blog.csdn.net/qq_26769591/article/details/80848841

（8）团队合作的一些心得

1.软件解决不了的，就用程序，最厉害的是，能用程序解决的问题都不是问题
2.不会乱不会重复做功不会丢失工作
3.经验丰富总能拿出一种解决方案
4.想做的总是能实现搜不到的试着试着就出来了再难的软件都可以被破解再难的功能都能被解锁再难的操作都能被逼近
5.大致方向总是不差错也只是参数不是思路不是算法
6.不会停滞不会闲置每天都能前进没思路的时候，基本的数据处理也是相当有意义的
7.同步思路和进度已经当前要做的事和要解决的事能保持同一水平线
---------------------