全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 JMP论坛
1333 0
2020-10-19

​​智慧制造是股份公司在新形势下技术发展的必然趋势,也是在激烈的市场竞争中赢得主动、立于不败的重要保证。1580 热轧智能车间建设是宝钢第一个作为国家工信部试点的示范智能化项目,通过引进和升级现有技术和装备,宝钢迈出了钢铁工业智能化升级的步伐。



本文将详细介绍宝钢如何应用基于JMP Pro的智能算法,预测1580热轧精轧的自然宽展的项目实践,也是2020 JMP Discovery Summit China宝钢股份设备部数模主任工程师朱健勤先生当天演讲内容的补充。本文经作者授权发布,未经许可,不得转载。


一   项目背景—为何需要JMP Pro?

宝钢 1580 热轧智能车间建设工程中,精轧动态宽度控制(DWC)系统由德国普瑞特公司(Primetals Technologies Germany GmbH,简称 PT)将其精轧自然宽展预测及自适应的神经网络模型嵌入到 L2 系统中,通过 L2 过程参数的输入,计算精轧自然宽展的预测值,用于确定粗轧目标宽度及轧后自适应,并作为参考值传送至 L1,由 L1 实现精轧宽度的动态控制,从而显著地提高了 1580 热轧精轧出口宽度的控制精度,其模型预测值与实际值的平均偏差仅有 1.38mm(2019 年 1 月~9 月),参见图 1。


图 1..png

图1



然而,德国普瑞特公司提供的精轧自然宽展预测及自适应神经网络模型是一个黑箱模型,其源代码是经过加密的,无法阅读或修改,也没有模型结构说明,因而无法进行参数调整、模型调优等改进工作。


因此,团队希望能够通过应用JMP统计分析产品家族的其他机器学习、深度学习等人工智能建模工具,开发出一个智能模型,用于宝钢股份1580热轧厂的精轧自然宽展预测,籍以替代德国PT公司的黑箱模型,并使该自主开发模型的预测值与实际值的偏差达到月平均值≤1.7mm,从而基本达到德国黑箱模型的控制水准。


基于此,团队开始借助于JMP Pro中的预测建模工具作进一步的尝试和探索。


二 智能化预测模型的建立


1 数据的收集与清理

团队采集了 1580 热轧 2019.01~2019.09 共九个月的精轧生产数据,并编制 SAS 程序对其中 2019 年 1~8 月的数据进行清理与整合,共提取出有效数据 85423 块带钢,并汇总形成 Excel 数据文件。


2 数据筛选


图2.png
图2

02  普瑞特(PT)公司经验传承

由德国普瑞特(PT)公司提供的自然宽展神经网络模型分析诊断系统的输入/出界面,不难看出该神经网络黑箱模型需要化学成分、精轧入口宽度、出口宽度等 33 个输入变量, 参见图 3。

图3.png

图3



03  数据合成


团队将 JMP Pro的Bootstrap森林算法筛选的关键因子与普瑞特(PT)公司神经网络模型所需的输入变量进行对比,可以发现有 4 个影响因子是相同的,它们是预计算的精轧目标宽度及化学成分硅(Si)、铌(Nb)等。


同时,根据生产质量分析经验,不难看出粗轧实际宽度、粗轧后半宽度实际值、粗轧目标宽度等因子之间存在自相关性,并且这些变量与团队需要拟合的目标实际自然宽展(spread_ACT)也存在线性相关性。应用JMP Pro 的多元线性相关性分析工具对这八个影响因子及自然宽展实际值进行分析,可以看到八个影响因子之间呈强相关关系(相关性系数 r>0.99),且与自然宽展实际值的相关性也比较强(r>55%)。参见图 4。


图4.png

图4


除此以外,出钢记号(alloyCode)有 1000 多个,虽然其对自然宽展有影响,且贡献度最大,但由于维度太大,无法进行拟合,可以另行采用表格方式进行自适应学习。


因而经过讨论,最终决定将这 9 个变量删去,加上重复的 4 个变量共删去 13 个影响因子。这样 31 个影响因子还剩余 18 个,加上普瑞特公司经验传承的 33 个因子,最终确定 51 个影响因子。


3  数据准备

针对最终确定的影响精轧自然宽展的 51 个影响因子,团队采集了 2019 年 6 月至 8 月共三个月的数据(共 30533 块带钢),应用 JMP Pro读取这些数据,并将精轧自然宽展实际值作为目标值(Y,响应变量),51 个影响因子作为拟合数据(X,自变量),并随机设置该拟合数据集的 80%作为训练集,20%作为验证集。


三  智能模型的训练及离线拟合


团队尝试应用 JMP Pro分析软件中的两种智能建模方法:神经网络及 Bootstrap 森林法分别对上述数据集进行训练和验证,得到如下结果:


1 应用神经网络建模方法

图5 图6.png

  图5                                      图6



由图5和图6可知,应用神经网络算法训练拟合后得到的模型,用验证数据验证后的决定系数 R2 为 0.858,RMSE 为 1.506,绝对偏差的平均值为 1.16,理论上已经达到了团队设定的目标。


图6给出了三种模型的预测值(从左至右依次是 JMP 模型、PT 模型及宝钢现有模型)与实际值的散点图,从中可见 JMP 拟合的模型其离散程度是最小的。


2  应用Bootstrap森林法建模方法
图2图

图7图8.png
图7                                               图8

由图7和图8可知,应用 Bootstrap 森林法训练拟合后得到的模型,用验证数据验证后的决定系数 R2达到了 0.863,RMSE 为 1.48,获得了更高的预测精度。


同样,图8给出了三种模型的预测值(从左至右依次是 JMP 模型、PT 模型及宝钢现有模型)与实际值的散点图,从中可见 JMP 拟合的模型其离散程度是最小的。)


由上述两种智能模型算法的应用可以看出,Bootstrap 森林算法的拟合效果比神经网络要好,预测精度更高,这两种建模方法都达到了项目团队的目标。


但是,这仅仅是对数据的理论分析结果,究竟实际应用效果如何,还是要用现场的实际控制数据来说话。如何将这些智能算法建立的模型应用于实际控制才是真正有意义的工作。


JMP Pro软件的模型导出功能为团队架起了理论到实践的桥梁,跨越了离线分析到在线应用的鸿沟,使得天堑变通途。



四  智能模型的在线验证

1 模型的导出

应用JMP Pro 软件将这两种智能模型算法转换成了 C 语言代码,从而为智能控制模型在现场的实际应用,跨出了关键性的一步。


2 模型的在线验证

将两种智能模型算法转换成的 C 语言程序代码经过编译后集成到 1580 热轧粗轧过程计算机离线模拟机的预设定进程中,然后应用 2019 年 9 月份的数据进行测试,即输入因子是 9 月份的带钢实际数据,运用智能模型预测精轧自然宽展,然后采用普瑞特 PT 公司相同的标准差计算公式分别计算宝钢模型、PT 公司模型和 JMP智能模型的标准差,参见下图 9:



图9神经网络模型 VS 森林法.png

图9



由图 9 可见,从实际预测结果看,JMP 森林法拟合得到的模型,其预测结果已经达到了宝钢现有模型的预测结果!


五  项目小结及经验


通过运用JMP Pro软件中的智能分析及建模方法,团队对 1580 热轧精轧自然宽展的预测值、实际值以及相关参数进行了训练、验证和拟合,得到了神经网络和Bootstrap 森林两种智能控制模型,其理论预测精度和验证精度完全达到了德国普瑞特公司的神经网络模型精度。


同时,借助于 JMP Pro软件的模型发布功能,团队获得了其 C 语言的程序代码,并在现场过程控制计算机的模拟机上进行了预设定进程实际测试,取得了非常好的效果,从而为下一步开展在线生产试验和验证奠定了充实的基础。


除此以外,在分析和建模过程中,团队也总结了以下几点经验供大家参考:

  • 训练数据的时间跨度不宜过长,以 3~4 个月为宜;
  • 训练验证的数据量不宜过大,以 3~4 万条记录为宜;
  • 如果配以自适应学习功能,可以使预测精度更高。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群