本研究旨在通过比较六种基于机器学习的模型来预测越南生活固体废弃物。输入数据包括八个变量,涵盖研究区域的经济、人口、消费和废弃物产生特征。模型仿真结果表明,城市人口、平均月消费支出和总零售额是影响城市生活废弃物产生的主要变量。在六类机器学习模型中,随机森林和k最近邻算法对训练数据集(80%的数据)具有良好的预测能力(决定系数>0.96),且在测试集(20%的数据)上的平均绝对误差为121.5–125.0。基于机器学习模型的预测结果有助于越南的综合固体废弃物管理行动计划的规划、设计和实施。本研究的局限性体现在数据集的异质性,如越南下级行政部门缺乏有效数据。基于此,当未来能够获取更多的可靠数据时,可以更新和重新训练机器学习预测模型。
图1. 预测变量与响应变量的统计直方图
图2.预测变量重要性以及交叉检验的均方根误差
图3. 各模型的平均绝对误差
图4.训练集与验证集的平均绝对误差
图5.预测值与真实值比较
来源: rcr期刊