当前位置:益聚文秘网>范文大全 > 优秀范文 > 基于机器学习的钢材需求预测研究

基于机器学习的钢材需求预测研究

时间:2023-09-07 18:45:02 优秀范文 来源:网友投稿

崔 煜,丁 东,张 航

(哈尔滨工业大学[深圳]经济管理学院,广东 深圳 518055)

钢铁实际需求以及供需关系对于钢材价格的影响是一个值得研究和关注的问题。对于钢铁企业,均衡的供需关系不仅能使社会经济健康发展,也可进一步实现企业利润最大化;
对于中国宏观经济发展,钢铁行业是实现我国国民经济高速发展的支柱产业。中国是世界产钢大国,也是钢铁消费大国,随着中国对外开放的程度越来越高,国内市场的供需稳定对于世界来说也是至关重要的[1]。

关于如何量化钢铁实际需求,已有一些研究基础。比如陈程 等[2]介绍了3种预测钢材需求的方法,分别为钢材消费系数预测法[3]、分地区消费预测法和下游行业消费预测法[4]。其中,钢材消费系数预测法即基于钢材消费弹性系数与GDP增速和固定资产投资完成额增速的线性关系,并结合未来趋势分析后设定系数,并给出高速、中速、低速3种国民经济发展状况预测[5]。下游行业消费预测法则是根据用途和消费领域不同,将国内钢材消费分类,结合我国各下游用钢行业发展趋势、钢材品种消费特点进行分析,最终给出2025年钢材需求预测[6]。

本文借鉴之前研究的分析框架,并在方法上有所创新,在数值精确度上有更严格的要求。即结合钢材下游行业以及宏观经济背景将影响钢材需求的多维度变量作为输入,通过机器学习在多维空间构造特征并训练,得到更加复杂的神经网络结构,形成更加精准的钢材实际需求计算系统。目前机器学习在计算机领域、统计学领域早已有非常丰富的研究成果,而且发展速度很快,在数据计算、多维数据拟合等方面,机器学习都表现出了明显的优势。然而,目前在钢铁行业使用机器学习方法的研究还比较有限。

在学术研究层面,本文从研究钢铁实际需求这个角度率先对于前沿方法进行应用尝试,一方面实现对于钢铁实际需求量判断的又一计算方式补充;
另一方面推动前沿算法技术对于传统钢铁行业研究范式的升级优化,以及机器学习与行业研究的进一步融合。

在行业发展层面,本文对于钢铁实际需求量的研究计算,对钢材市场的供需水平和价格变化的了解提供参考;
从政府角度,可以为是否需要政策调控的决策提供研究支持;
从行业协会角度,可以为如何组织产供需市场的调派提供数据指导;
从企业角度,可以通过需求的预期灵活调整生产、采购、销售等各环节的资源配置,提高市场竞争力,实现利润最大化。

本文算法的主要思路是将训练集的钢铁下游需求侧以及宏观经济面板数据转化为输入,利用GBDT[7]算法深度挖掘输入变量间的非线性关系,并通过全连接网络训练[8-10]与钢材供给量构造供需缺口,最终以钢材价格涨跌作为最终输出。通过模型的训练与评估,可得到用于测试集的模型结构、参数和权重,并得到钢材实际需求监测预警模型,模型基本流程如图1所示。

图1 钢材实际需求监测预警模型基本流程

1.1 数据获取

本文假设供需的缺口与商品价格变化之间有着强相关性,即在该假设下通过价格的变化幅度反向量化理论上的供求缺口的大小。本文认为理论上的需求所涉及的影响因子主要来源于钢铁下游的重点行业,如房地产、建筑、机械制造、汽车制造、家电、造船以及能源等行业。

除了下游行业作为影响因子外,货币因素和宏观因素也同样重要。由于市场需求可以分为现实需求和潜在需求,转化成需求量需要资金的支撑,这就是货币流动性对于钢铁需求重要的原因,所以本文纳入M2和社会融资规模来反映宏观货币端的变化。最后,由于钢铁行业需求的变化有明显的季节性,因此在考虑特征时,时间变量也考虑其中。

1.2 数据预处理

由于特征之间存在着量纲的差异,为了消除这种差异,需要对数据进行标准化处理。本文使用Z-score 标准化对数据进行处理。

1.3 模型训练

在GBDT完成对特征的扩充工作之后,经过特征组合得出数据输入给神经网络进行回归训练。本文针对钢铁需求端的需求量预测使用的模型是全连接网络模型(FCN)。

神经网络最后的输出量y针对钢铁行业消费端,也就是对消费钢材行业的各种因子进行了特征提取,并缩减维度后的一维数据。本文希望钢铁的供求关系可以与钢材价格指数的涨跌建立比例函数关系。所以目标函数确定为拟合钢铁的需求供给差与钢材价格指数同比之间的误差,而这个误差用均方误差(MSE)表示。

(1)

网络结构由多层线性层组成,每一层分别用ReLU作为激活函数,并设置dropout以控制网络的过拟合。最后一层输出维度是1,即为需要求得的钢铁需求量。训练模型时使用Adam作为优化器。

1.4 模型评估

本文从两个维度对模型进行评估。一方面,对模型本身的训练效果进行评估;
另一方面,采用供求缺口和价格涨跌的正确率对模型进行评估。对于模型本身的训练效果,使用MSE来进行评估,选择MSE 较小的模型,是从数值角度对模型体系作出的判断。将钢材的产量和模型给出的需求量结果作差,可以计算出钢材的供求差,若供求差大于0,即供给大于需求,则预示价格将要下跌,反之价格则要上涨。

(2)

2.1 数据说明

本文特征体系的历史数据来源于Wind数据库,未来预测数据来源于腾景数科。数据均选取2008年1月—2021年10月的月度数据,共166个样本。将数据进行归一化处理以消除量纲。本文对数据划分训练集、验证集和测试集。训练集从2008年1月—2020年7月,验证集为2020年8月—2021年4月,测试集从2021年5—10月。为防止使用未来数据,使用训练集的均值和方差将全部数据集进行标准化。为验证模型对未来的预警性,作为测试集的输入x,本文使用腾景数科在2021年4月发布的2021年5—10月的数据代替目前已经发布的真实值,以得到对应的预测结果。

2.2 基于GBDT 和 FCN 的模型系统效果分析

影响钢材实际需求监测预警模型的因素主要有:是否进行特征组合、特征组合GBDT模型迭代次数、神经网络层数及形状、是否添加随机失活机制、训练次数及学习率。本文采用控制变量实验针对不同的影响因素作出实验分析,实验结果中准确率均为验证集的结果计算出的供求缺口和价格涨跌的正确率。

根据实验结果,选择验证集准确率最高、MSE最小的参数组合,最终选择的参数组合见表1。

表1 最终参数组合

选择上述的参数组合进行模型训练,最终得到的结果为:训练集准确率为92.72%,验证集准确率为88.89%。

2.3 钢材实际需求监测预警模型拟合需求量与表观消费量的对比分析

钢材实际需求拟合消费量在同比值上与表观消费量波动方向类似,但波动幅度较表观消费量更加敏感。在绝对值上,与表观消费量相关性较强,在2015—2017年数值上有所偏差(见图2)。

图2 钢材实际需求与表观需求量对比图

表观消费量的计算方法为:当年进口量-当年出口量+当年产量。在反映市场真实需求时,表观消费量存在两大不足:一是大量的钢材库存被忽略,未能反映其中;
二是由于计算公式中出口项前边是负号,因此当出口需求较大时很有可能对于实际需求量造成低估。本文通过将供需缺口与实际市场价格变化相绑定的做法,让拟合的需求量更接近于直接影响价格变化的理论值,从而得到的数据显示在供给侧改革阶段(2015—2017年),钢材实际需求拟合消费量要高于公布的表观消费量。接下来,从钢材库存指标和钢材出口指标为这段时间的价格偏差加以解释。

2.3.1 钢材库存指标与钢材实际需求拟合消费量

2015—2017年供给侧改革使得钢材产量增速放缓,表观消费量受到影响出现下行,但从钢材库存指标来看,该时间段内库存出现大幅下滑,极大可能通过库存弥补了实际需求造成表观消费量相较实际消费量的低估。

为了证明钢材实际需求拟合消费量(以下简称拟合消费量)在一定程度上弥补了表观消费量对于钢材库存的忽略,本文分析了拟合消费量和表观消费量的差值。从年度数据来看,钢材库存年度同比和拟合消费量与表观消费量之差的同比有非常强的负相关关系。当拟合消费量与表观消费量之差扩大时,钢材的库存反而缩小。这表明:当拟合消费量相较表观消费量变大时,将伴随着钢材的大量出库,出库的钢材对于市场需求提供了大量的补充,最终留存下来的库存反倒较少。因此,钢材库存是拟合消费量与表观消费量不同的重要原因,也证明了拟合消费量相较于表观消费量更能反映真实需求。

2.3.2 钢材出口与钢材实际需求拟合消费量

根据表观需求量的计算公式,钢材出口量是抵减项,代表在国内生产量基础上要扣减出口才能代表当期国内的需求。但出口也是拉动需求的一项重要因素,当钢材出口强劲时,实际市场需求是强烈的,如果通过表观需求量减去强劲的出口,会造成严重低估实际市场需求的情况。从年度的钢材出口和拟合消费量与表观需求量之差的对比可知,出口数量高时,会拉大拟合消费量与表观需求量的差距,因此一定程度上弥补了表观需求量受计算方法所限而对于实际消费量反映不足的缺陷。

2.4 钢材实际需求监测预警模型拟合需求量与需求指数结果

在模型拟合需求量的基础上,为了方便后续研究,本文以2012年为基年构造了钢材实际需求指数。该指数以2012年作为定基时间点,2012年全年的平均月钢材实际需求量为100,其他月份指数由相对于2012年月均钢材消费量计算得出。钢材实际需求指数反应的是拟合消费量每月的情况。指数的变动反应的是拟合消费量变动的强弱,指数变动的方向反应拟合消费量的变动方向。在定基指数的基础上可以继续做同比或环比的计算研究。

2.5 预测数据描述

为了验证钢材实际需求监测预警模型的预测功能,本文采用前期对于重要经济指标的预测研究成果作为此次预测数据来源,对2021年5—10月钢材实际需求量进行预测。

总体而言,每个行业未来运行态势各异,各个行业不同的运行态势最终共同作用于钢材的整体需求,当一个行业的运行态势发生变化时,钢材的整体需求也会随之变动,因此行业的历史数据和预测数据都对模型整体起到至关重要的作用。

2.6 系统模型的预警性及结果

模型训练完成后,将未来预测数据纳入训练得到未来的钢材需求量,结果见表2。

表2 拟合钢材需求量及需求指数

根据供求关系,运用拟合需求量和钢材产量推导出的价格涨跌和实际价格涨跌情况见表3。

表3 推导价格与实际价格对比

根据上述结果可知,模型系统对于未来的钢材价格涨跌情况有很好的预警性,使用预测数据对未来的钢材价格判断准确率可达83.3%。2021年7月判断错误主要源于2021年情况较为特殊,作为“碳达峰元年”限产政策陆续落实,再加之上半年原材料价格疯涨而挤压中下游利润。6—7月徐州钢厂、宁夏中卫铁合金及钢厂、唐山烧结机等均再次限产,江苏、浙江等地也有类似储备限产措施。在限产作用下,钢铁持续挤占上游铁矿利润,毛利率提升空间大且具有持续性,行业经历前所未有之变局。

根据本文研究内容,提出以下3点政策建议。

1)国家和政府发挥好“指挥”和“协调”的宏观政府职能,对恶意影响市场价格的行为进行及时监管,保证供需的动态平衡和长效平衡。建议行业协会等社会组织要着力维护钢铁行业和相关行业的市场经济秩序,推进公平、公正、有序的市场竞争。钢铁企业要建立科学完善的价格决策机制以及适应市场变化的价格运行体系。

2)开拓国外市场,形成全球化布局,发挥我国在钢铁行业上的领先优势,通过开放的国际市场进一步实现良性的经济循环。优化出口钢材的产品结构,增加国际市场竞争力,促进国内产品技术的革新升级,进一步实现高质量发展。

3)推进前沿智能技术与行业决策研究的融合。积极鼓励跨学科领域的创新并予以较高关注;
重视培养钢铁行业与人工智能技术双重技能的人才;
重视行业数据的准确性、及时性和适度公开性,为进一步创新开发提供研究素材。

猜你喜欢需求量消费量钢材承压设备用钢材使用焊接性探讨中国特种设备安全(2021年5期)2021-11-06从数学角度看“弹性”数学大王·中高年级(2021年6期)2021-09-27钢材集中采购管理思考探究大众投资指南(2021年35期)2021-02-16价格战是一定的! 2020年虾苗需求量预计减少10%~20%,苗价下调是趋势当代水产(2020年2期)2020-03-17韩国电企2月份煤炭消费量同比下降18.5%矿山安全信息(2020年12期)2020-01-05钢材分类标号(一)新疆钢铁(2016年3期)2016-02-282014年全国纸及纸板生产量为1.0470亿吨印刷技术·数字印艺(2015年6期)2015-08-312017年我国汽车软管需求量将达6.4亿m橡胶科技(2015年3期)2015-02-26N2015083 中国铜铝消费量料在未来十年达到顶峰中国有色冶金(2015年5期)2015-01-28基于BP神经网络人均猪肉需求量预测湖南农业科学(2014年8期)2014-02-27

推荐访问:需求预测 钢材 机器

猜你喜欢

版权所有:益聚文秘网 2015-2024 未经授权禁止复制或建立镜像[益聚文秘网]所有资源完全免费共享

Powered by 益聚文秘网 © All Rights Reserved.。备案号:豫ICP备15012371号-1