本帖最后由 2238126742 于 2023-9-7 13:22 编辑 * l3 M8 W; t4 n, I2 K" P8 ?% i
5 o8 E- D: B- ]* n3 A% N% q
![]()
; Q- [6 f) p. v* R8 V4 Q: r01两大处理两大处理包括数据清洗和数据变换,具体说明如下: 数据清洗一般包括缺失值处理和异常值处理,如果数据中有缺失值,可以进行删除处理,或者平均值、中位数、众数等填充,其中众数一般适用于分类数据,除此之外,还可以使用线性插值、牛顿插值、拉格朗日插值法进行插值可以参考下方资料。 ![]() 数据变换:有些数据在分析前还需要进行变换,处理量纲问题等,比如因子分析或者主成分分析前需要将数据标准化,一些综合评价法也需要将数据进行处理,比如指标为正向(越大越好),则可以进行正向化处理,有些指标为负向(越小越好),则可以进行逆向化处理等等,可以参考下方资料。 ![]() 标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。 归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。 中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不需要进行特征之间的比较的情况。 正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。 逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。 适度化:这种方法适用于指标值差异较大的情况,比如消费者对某产品的满意度等。 区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。 参考资料 02四大模型四大模型一般包括评价模型、预测模型、分类模型以及优化模型。 8 O- a! L8 A! l$ U0 F
评价模型评价类模型一般包括权重计算和进行综合评价对比,分析前搜集原始数据,然后对数据进行预处理,比如标准化,正向化逆向化等等,一般评价类模型,需要将计算权重的模型和进行综合评价的模型相结合分析,比如熵权topsis法等,计算权重包括主观方法和客观方法,各自有各自的优缺点,但在分析中往往二者相结合进行分析对比更为准确,一般最终目的得到综合评价结果。具体如下: ![]() 评价模型的方法说明如下: ![]() 一般在分析评价类模型是通常采用组合赋权法,即通过主观赋权法和客观赋权法综合得到权重,然后结合综合评价方法得到结论。参考资料如下: 预测模型预测模型一般包括回归预测模型、时间序列预测模型,灰色预测法、马尔科夫预测、机器学习(神经网络、决策树)等。一般预测模型的流程如下: ![]() 时间序列模型 时间序列模型是一种根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法,如非线性最小二乘法,来对时间序列数据进行拟合,从而建立相应的数学模型。适合中长期预测。 参考资料: 灰色预测法 灰色预测模型为小样本预测模型,适合短期预测,其利用微分方程来充分挖掘数据的本质,建模所需信息少,精度较高,运算简便,易于检验,也不用考虑分布规律或变化趋势等。 参考资料: 马尔科夫预测 马尔科夫预测是一种基于马尔科夫链的预测方法,主要用于预测随机过程未来的状态。这种方法假设一个系统的下一个状态只与前一个状态有关,而与之前的状态无关。 参考资料: 其它: 建议选择预测模型时也建立分析流程,比如进行时间序列预测: 分类模型分类模型一般可以解决国赛数学建模的小问,一般常用的方法有聚类分析、判别分析以及机器学习(决策树、神经网络等)等。聚类分析前提不明确数据对象应该分为几类,常用的计算有欧式距离、pearson相关系数、夹角余弦法等,判别分析一般是分析前就明确观察对象应该分为几类,一般在分析中可以将二者结合进行分析以及还有机器学习可以进行分类。 优化模型一般可以利用优化模型得到最优目标,比如在经济问题、生产问题、投入产出等等,人们总希望用最小的投入得到最大的产出,一般分析的流程如下: ![]() 其中决策变量一般有0-1规划或者整数规划,通过目标函数和约束条件,确定优化模型的类型,一般有动态规划,线性规划,非线性规划以及多目标规划。 03六大算法一般常用的算法有现代优化算法、蒙特卡罗算法、规划算法、图与网络、排队论以及差分和微分等。 现代优化算法现代优化算法一般包括遗传算法、模拟退火法、禁忌搜索法、蚁群算法等。一般遗传算法通常解决决策变量为离散变量时,跳出局部最优解的能力较强,模拟退火法跳出局部最优解能力最强,紧急搜索法是组合优化算法的一种,可以记录已经打到过的局部最优点。 蒙特卡罗算法蒙特卡罗算法主要手段是随机抽样和统计实验,利用计算机实现统计模拟或抽样,得到问题的近似解,可以进行微分方程求解,可以将微分方程转化为概率模型,然后通过模拟随机过程得到方程近似解同事也可以解决积分方程非线性方程组等等。 规划算法规划算法一般用于解决优化模型,常用的动态规划、线性规划、非线性规划、多目标规划、整数规划等。 图与网络图与网络算法可以解决最小路径问题,最优着色问题,最大流问题,以及最小生成树等问题,但是其计算复杂度较高,并且消耗大量资源和储存空间。 排队论排队论研究的内容包括性态问题、最优化问题以及排队系统的统计推断,排队论主要是解决服务系统的排队问题,通过分析排队系统的概率规律性和优化问题,提出最优的排队策略,同时也可以提供精确的数学模型,对排队系统的性能进行定量分析和预测,如平均等待时间、平均队列长度、平均服务时间等。但是使用该算法需要很多参数,需要保证参数的精确性。 差分和微分差分算法可以解决连续型问题,能够用迭代的方式求解方程,避免了微分方程中的导数,更便于计算。例如商品销售量的预测等,微分算法适用于基于相关原理的因果预测模型,大多是物理或几何方面的典型问题,可以通过数学符号表示规律,列出方程,求解的结果就是问题的答案,可以处理连续型问题,假设条件清晰,规律性强。但是涉及求导所以计算更复杂。 04建模六个步骤建模的六个步骤一般如下: 5 m q% E4 m+ ?: r, A% }
05比赛技巧1、多画图 可以在论文中多画图进行描述问题,更加直观,可以使用SPSSAU、python、以及R和MATLAB等等。 2、排版 可以使用LaTeX或者Markdown文档,LaTeX数学符号和命令很方便,还可以处理复杂的数学公式和图表。Markdown与LaTeX相比,Markdown语法简单,易于上手。它可以将Markdown文本轻松转换为HTML、PDF等格式的文档。还有其他的软件,比如Office、WPS等,但它们可以根据个人习惯和需求,选择适合自己的排版软件即可。 3、摘要 一定要重视摘要,因为评委可能看你的论文的速度特别特别快,如果没有亮点很大可能不能拿奖,一定要写明自己分析什么问题,如何解决,用了哪些方法,得到了什么结论,并且整篇论文的格式也需要规规整整,可以多读几篇优秀论文然后在进行书写。 祝大家取得好成绩! https://www.spssau.com/?1000012173 {% ?4 s: |4 k( G* g2 J/ D
( l! w; c D; [* J) s
- T$ q _6 W+ ] F* O3 }* i& S |