- 在线时间
- 463 小时
- 最后登录
- 2025-6-15
- 注册时间
- 2023-7-11
- 听众数
- 4
- 收听数
- 0
- 能力
- 0 分
- 体力
- 7340 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 2780
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1156
- 主题
- 1171
- 精华
- 0
- 分享
- 0
- 好友
- 1
该用户从未签到
 |
近年来,小型汽车已经成为了家庭中常用的交通工具。虽然它们提供了方便和舒适的交通方式,但是汽车尾气排放对大气环境产生了严重的影响,成为了一个迫切需要解决的问题。辛烷值和硫含量是衡量汽油燃料燃烧性能和清洁性的两个重要指标。因此,比较分析和挖掘汽油相关指标的关系,寻求控制和优化汽油含硫量和辛烷值等方法,对于理解汽油精细工艺和保护大气环境至关重要。
* O! p7 ^8 c/ |$ t' ?! r在这篇论文中,首先基于各类数据样本,并利用Python、MATLAB等分析工具,综合运用了各类数据处理和分析方法,例如随机森林模型、BP神经网络模型、XGBoost模型和粒子群优化算法,旨在研究汽油中辛烷值和硫含量两个重要指标与其他操作变量之间的关联程度,并通过数据挖掘技术进行建模,从而提出优化方案以控制辛烷值和硫含量。6 ^, N6 |; Y, w
对于问题一,需要对附件三中的285号和313号原始样本数据进行数据预处理,并将处理后的数据分别加入到附件一中相应的样本号中。通过Python软件进行预处理,首先使用拉依达准则去除样本数据中的异常值。然后根据原始样本集的操作范围对样本数据进行范围限制,使用最大最小限幅方法剔除不在范围内的数据。接下来,统计空白值,并计算前后两个小时的均值作为填充值。最后,计算处理后的285号和313号样本数据在位点数据上的干均值作为最终的处理结果,并替换到附件一相应编号的样本中。
; M8 l8 F6 M X" r, g针对问题二,需要对问题一得到的363个变量进行降维处理,筛选出30个以内具有代表性和独立性的主要操作变量。首先对初始数据集进行异常值剔除、空白值处理和最大最小归一化。然后使用随机森林算法构建特征提取模型,在调节优化参数的基础上计算各个特征的重要性系数,并按照重要性系数降序排列,选择前28个操作变量作为最终筛选结果。通过最大互信息系数对这28个变量进行相关性分析,验证它们具有较好的独立性。( T% t: w3 Q, F7 R
针对问题三,需要利用问题二中提取的主要变量使用数据挖掘技术建立辛烷值(RON)损失预测模型,并对该模型进行验证分析。本文分别使用BP神经网络算法和XGBoost算法建立辛烷值RON的损失预测模型。首先设计一个5层的神经网络结构模型,其中输入层有28个神经元,分别对应问题二中最终筛选的28个主要操作变量。然后通过隐藏层和输出层得到汽油辛烷值损失和硫含量两个预测变量。为了进行结果的横向对比,还建立了基于算法的预测模型。为了避免过拟合,采用交叉验证的方法对两种模型进行训练和测试。最后,使用MSE、RMSE和MAE等性能系数对两个模型的拟合结果进行比较分析,发现两种模型的拟合误差约为0.048和0.041,拟合程度较好,且XGBoost模型的拟合程度优于BP神经网络模型。6 e8 o( n$ {. \
针对问题四,在保证硫含量不大于5g/g的前提下,利用问题三中的模型得到辛烷值损失降幅大于30%的样本对应的主要变量优化后的操作条件。使用粒子群优化算法对不满足损失降幅大于30%的325个样本进行优化,以辛烷值损失作为自适应函数,在硫含量小于5g/g的约束下,通过粒子群的搜索,找到辛烷值损失的最小值,并保存最优粒子的空间位置作为28个变量的优化值。: Q2 h6 u8 X3 N) s! C/ c% ?
对于问题五,需要实现模型的可视化操作,显示汽油辛烷值和硫含量在操作变量优化过程中的变化轨迹。由于工业装置修改操作变量时只能逐步调整,遵循每个主要变量的最大最小值和133号样本的取值范围,按照变量的步长逐个改变主要变量的取值,并带入预测模型,显示辛烷值和硫含量的变化轨迹。
, K7 [) F, H6 _1 P5 X: w% [9 R. ]这篇论文中所构建的模型都经过了交叉验证和评价,并根据模型的应用结果对各个模型的优缺点进行了评价,同时还提出了改进的建议。
! |& c. z/ |8 l) H' x+ U4 {有论文有代码,上海大学。
0 o- ]' {! w0 y" N& l
/ N& c* w+ z1 m+ d8 } |
zan
|