物联网、无人机、新社交媒体平台等技术的发展和广泛应用,为人类社会拓展出前所未有的自主性空间,促进了新的社会关系形态和社会场域——网络社会的形成(jones,1996)。网络社会已经成为现实社会的数字孪生与拓展延伸,它通过影响社会控制力和社会规范制度重构了整个社会。在此背景下,将社会治理领域从现实社会拓展至网络社会具有重要的理论和现实价值。
数据作为重要的信息载体,记录着各种现实和网络社会活动。当前,更便宜、更易访问的数据存储、分析、共享和分发工具带来了全球数据量的爆炸性指数增长。政府和商业公司都意识到了大数据的巨大价值。他们利用各自的优势,从海量的、非结构化的数据中挖掘信息为商业管理和社会治理决策提供支持。通过机器学习、图像识别和自然语言处理等人工智能技术,我们在数据收集、处理、优化和预测方面取得了重大进展。这些进步让我们能够从大数据中观察社会运行机制,帮助决策者提高社会治理的现代化水平。在这种背景下,大数据在社会治理中的作用已经成为当前管理研究的热点。
作为社会治理不可或缺的领域,环境治理体系和治理能力的现代化是一个重要方面。环境治理由于时空尺度庞杂、污染物与污染介质交互效应复杂、涉及利益相关主体决策不确定性高等特点,为大数据和人工智能的应用提供了极大的空间(zhong等,2021)。系统理解大数据和人工智能在推动环境治理模式转型中的作用,符合国家战略需求,并且具有跨领域的示范意义。迄今为止,有关大数据在环境治理领域的研究多是实例研究,侧重于阐述特定应用场景实现的技术路径。他们揭示了局部情况,但未能形成系统思维。
本文提出了大数据在环境治理中作用的概念框架,阐述了当前值得关注的前沿应用场景以解释该框架,强调了来自广泛学科的学者感兴趣的研究前沿。最后,本文从系统工程的角度阐述了在我国相关实践中面临的挑战应采取的策略。
2
概念框架
本节提出了一个大数据在环境治理中的概念框架(图1)。它是一个供需匹配过程。环境大数据与人工智能技术的结合为满足环境治理需求提供了多维的正版威斯尼斯人8206下载安装的解决方案。
图1.大数据在环境治理中作用的概念框架
2.1 环境治理的需求
在需求端,现代化环境治理寻求的是精准、快速、低成本的信息感知、评估研判、预警调控与公众监督正版威斯尼斯人8206下载安装的解决方案。本小节阐述了当前和未来环境治理的迫切需求。
2.1.1低成本、高分辨率环境信息的需求
环境调查和监测是收集环境信息的两个渠道,是环境科学和实践的基础。我国已经开展过第二轮污染源普查、2018年固废清查、生物多样性调查、城市黑臭水体调查等诸多全国范围内的大型专项调查。与此同时,我国环境质量、污染源和生态环境监测监控网络的规模、分辨率和多样化也在不断提高。
尽管我国在环境调查与监测领域取得了这些进展,但是当前仍面临许多挑战。一方面,当前的大规模调查是对时间与专业人员需求巨大的横断面调查。因而,只能提供环境和生态状况的静态,甚至过时的信息。另一方面,现有的监测网络时空分辨率低,监测指标侧重于常规污染物的监测,缺乏特征污染物、生态指标、气候灾害指标的监测。在此背景下,降低环境调查成本,提高调查数据的时效性,将特征污染物指标、生态指标、气候灾害指标纳入监测网络是提高环境治理系统信息感知能力的关键要求。
2.1.2 科学高效环境评估和预测的需求
此外,环境趋势的预测主要依靠物理或化学模型模拟。例如,全球气候模型、区域空气质量模型和流域水动力模型已被广泛用于不同情境下的全球升温、pm2.5浓度和水环境质量预测,并进一步指导调控策略的制定或选择(wang等,2021;zhu等,2021)。然而,这些模型中固有的不确定性意味着需要新的独立方法来验证和支持预测结果。在此背景下,提高环境评价和预测的科学化水平和效率已成为一项显著需求。
2.1.3 环境预警和调控的需求
除对环境宏观趋势进行预测外,在企业个体层面对非法行为(如非法排放和倾倒)进行预警和监管也至关重要。当前,视频、传感器、无人机、在线监测设备、人工采样等多种手段采集的海量企业个体行为数据主要通过人工判断或简单逻辑判断的方式转化为辅助监管环境主体行为的预警信息。例如,管理人员通过人工观察监控画面中污水的颜色或为在线监测设备设置固定的污染物浓度阈值来检测非法排放行为。这种预警方式面临着人工依赖性强、随机性强、预警效果差的问题。类似的问题也出现在废气和危险废物的管理过程中。
此外,我国在环境执法领域持续推行“双随机”制度,即随机抽取被检查对象和随机选派执法检查人员。然而,该方法可能会将有限的执法资源分配给违法概率较低的企业,从而导致执法效率低下。同时,潜在的选择性偏差可能导致决策者对当地环境绩效的误判。在此背景下,亟须寻找利用海量的视频、传感器、在线监测环境数据刻画企业环境违法动机,将环境数据转化为有效的预警和执法决策信息的正版威斯尼斯人8206下载安装的解决方案。
2.1.4 公众理性参与和监督的需求
除政府和企业外,公众的参与和监督也是环境治理体系的重要组成部分。网络社会信息高频无序互动使得公众面对环境事件和信息冲击时,无法有效甄别被放大的社会舆论,陷入应激的忧虑和恐惧状态,导致短期的社会风险放大。以《穹顶之下》视频引发的社会舆论为例,视频冲击使得在空气质量没有变化的情况下,公众感知到的危险度短期被放大,并且对公众的政府信任产生了长期且不断放大的破坏效应(liu等,2021)。与此同时,网络社会中信息传播和交流的实时化和扁平化,使得放大的社会舆论更容易转化为非理性的参与行为甚至群体性事件,严重威胁社会稳定。因此,引导理性的公众参与和监督也是环境治理体系现代化的重要需求。
2.2 基于大数据的环境正版威斯尼斯人8206下载安装的解决方案供应
大数据与人工智能技术的结合有望为上述需求提供多维的正版威斯尼斯人8206下载安装的解决方案。本小节总结了环境大数据来源以及正版威斯尼斯人8206下载安装的解决方案类型。
根据公认的大数据5v模型,大数据拥有五大特征维度:体量(volume)、种类(variety)、时效(velocity)、价值(value)和准确性(veracity)。虽然环境科学和实践中所涉及的数据在体量维度上无法完全满足大数据的严格定义,但其颗粒度、复杂度、实时性、准确度已经逐渐具备大数据的基本特征。因此,讨论环境大数据在社会科学研究中的应用时,必须关注到除了数据体量以外的其他特征。根据上述定义,环境大数据的来源非常广泛,包括政府、第三方、公众等。
政府数据通常来自大规模官方统计和调查,卫星遥感、高空雷达、无人机观测,环境质量监测站,视频监控、传感器和在线监测等。当然,第三方如非政府组织出于环保公益考虑通过视频、传感器等手段采集的环境数据也是重要来源。需要强调的是,环境大数据并不局限于与环境介质或污染源直接相关的数据。一些看似无关的数据在特定场景下也可以为环境科学研究与实践服务。这类数据包括来自移动信号、社交媒体、银行交易、用电监控、电子商务等。此外,公众也是环境大数据的供应方,其中最典型的例子就是环保投诉。伴随移动终端设备和自媒体平台发展,公众在环境数据采集和供应方面扮演着越来越重要的角色。
环境大数据和人工智能技术的结合可以从以下方面提供环境治理的正版威斯尼斯人8206下载安装的解决方案。
第一,通过同化融合来自卫星遥感、视频监控、gps、在线监测设备等传统环境大数据,打破数据孤岛,从验证现有调查、监测、监控等环境感知体系的数据可靠性、填补数据缺失、提高数据时空分辨率、丰富数据维度和内涵等多个方面,提升环境治理体系的信息感知能力。同时,网络社会中所有主体都成为信息的产生和供给方,进而颠覆了传统环境治理领域由政府主导的信息采集和公开模式。海量第三方和网络信息可以被作为由政府主导的环境调查、监测、监控等传统信息获取渠道的补充甚至代替,减少专业力量和视频监控、gps、在线监测设备等投入或优化提升投入的效果。因此,充分发挥大数据和人工智能技术在环境信息感知中的补充和修正作用是推动环境治理体系转型的重要正版威斯尼斯人8206下载安装的解决方案。
第二,基于机器学习、图像识别、复杂网络分析等新技术,通过扫描大量环境数据集,寻找看似不相关的变量之间的模式和关系,可以挖掘出原本可能因宏观数据加总而被掩盖的环境介质时空异质性和环境主体行为异质性的规律。这些规律的揭示将显著增强对生态环境客观趋势和环境主体行为的评估、预测、预警能力,进而提升环境治理体系的监管和执行效率。
第三,社交媒体、环保投诉等数据的爆发式增长和社区发现、自然语义处理等算法的发展,为模拟环境舆情甚至群体性事件的发酵过程和衰减规律、识别风险交流和干预的黄金窗口期、提升环境治理体系对环境事件和冲击的适应与恢复能力提供了正版威斯尼斯人8206下载安装的解决方案。第3节介绍了前沿研究中值得注意的应用场景,以帮助读者理解这些正版威斯尼斯人8206下载安装的解决方案。
3
前沿研究中值得关注的应用场景
围绕前述的环境治理需求,国内外学者已经展开了创新性的探索。本节阐述了多个学科值得关注的前沿应用场景,供不同学科背景的研究人员参考。
3.1 信息感知场景
运用机器学习模型同化融合等多源异构大数据,提高数据时空分辨率是大数据在环境治理领域最为广泛和成熟的应用场景。其中,受到学者关注最多的是运用卫星遥感观测、大气化学传输模型数据、地表监测站点数据等模拟no2、pm2.5、臭氧等大气污染物的高分辨率浓度分布reid等,2015;di等,2016)。例如,di等(2016)使用反向传播神经网络校准geos化学模拟美国东北部pm2.5浓度,将数据精度提升至1km×1km分辨率。liu等(2020)基于2013-2017年的我国每日最大8小时平均(mda8)臭氧观测值,结合同步臭氧反演、气溶胶再分析、气象参数和土地利用数据,建立了基于极限提升机(xgboost)的全国臭氧mda8浓度模拟模型,回溯了我国2005-2019年的臭氧mda8浓度分布,首次填补了2013年之前我国臭氧监测数据的空白。
除用于大气污染的调查和监测外,国内外研究也尝试应用大数据解决更多的环境调查和监测难题。例如,wen等(2018)基于高分二号(gf-2)卫星影像数据影像数据建模,为城市黑臭水体空间分布的调查和识别提供了正版威斯尼斯人8206下载安装的解决方案。lombard等(2021)使用增强回归树(brt)和随机森林分类(rfc)技术开发了机器学习模型,在1公里分辨率上估计了美国境内私人水井中砷的概率和浓度范围。yang等(2021a)使用从150篇期刊文章中提取的4420个数据点(1105种土壤),开发了六种重金属(cd(ii)、cr(vi)、cu(ii)、pb(ii)、ni(ii)和zn(ii))的土壤吸附的机器学习模型,模拟了全球范围内土壤的重金属吸附能力。moore和obradovich(2020)发现相较于分布稀疏的水文站点观测的潮位高度,公众发布的与洪水相关的推特数量能够从影响后果出发更好地捕捉和估计局部(即特定县)洪水阈值,解决小区域内洪水灾害调查和监测困难的问题。
这些最新的应用研究呈现出两大明显的发展趋势。一是应用对象由常规污染物向数据更难采集和观测的特征污染物、黑臭水体、气候风险指标扩展(zhong等,2021)。二是数据来源不再局限于传统的卫星遥感、地面监测、化学传输模式等,拓展纳入了实验室测试、期刊文献、新闻报道、社交媒体等新型数据源,作为由政府主导的环境调查、监测、监控等传统信息获取渠道的补充甚至代替(yang等,2021a;moore和obradovich,2020)。毫无疑问,这些趋势为未来大数据在环境感知场景中的应用指明了方向。
3.2 评估、预测、预警和调控场景
与大数据在环境信息感知中的应用研究相比,其在环境评估、预测、预警和调控场景中的应用研究相对零散,基本上可以归纳为生态环境质量预测调控和环境主体行为预警调控两类。
在生态环境质量预测调控方面,研究主要侧重于通过大数据和机器学习融合的方法为传统的基于全球气候模式、区域空气质量模型、流域水动力模型等的评估和预测结果提供验证,降低政策干预的不确定性。例如,vu等(2019)融合气象观测、地表空气质量监测、高精度排放清单数据,运用随机森林模型解耦气象因素影响后对北京市大气污染防治行动计划的效果进行了评估,为消除传统区域空气质量模型模拟中固有的不确定性提供了正版威斯尼斯人8206下载安装的解决方案。yang等(2021)基于实时的道路交通活动数据、气象观测、兴趣点等数据,采用随机森林模型对covid-19疫情封城以及未来电气化政策对洛杉矶城市交通no2浓度的影响进行了精准评估和预测,为电气化政策选择提供了来自环境大数据的证据。
在环境主体行为预警调控方面,研究者们也发现了很多有趣的应用场景。例如,lu(2019)通过建立行为指标和大数据分析技术挖掘一个包含2011-2017年900多万个废物处置记录的数据集,确定了非法倾倒行为的可能驱动因素(如排队时间过长),并成功预警了546辆涉嫌参与非法倾倒的垃圾运输卡车。除了非法行为预警,研究者们还利用大数据来优化响应行为。例如,almuhtaram等(2021)采用机器学习模型,分析识别饮用水公用事业公司安装的在线监测探针采集的藻蓝蛋白荧光数据的异常,为确定公用设施何时需要采取有害藻类水华的响应措施提供了行为指导。eyre等(2020)通过分析城市地区小企业在社交媒体上的在线发布活动数据,对自然灾害事件后中小型企业的复工情况进行预测,并指导优化政府应急资源的分配。
参照上述最新的应用研究,面向环境治理的需求,这里强调大数据和机器学习在非法环境行为预警中的潜力。例如,针对危险废物非法倾倒的问题,我们一方面基于产废企业的财务状况、原辅料投入、用电监控、工况监测、废气废水在线监测、危废申报等数据,采用机器学习模型可以建立企业危废理论产生量的预测模型;通过识别申报值与理论值的偏差判断企业非法倾倒危废的概率。另一方面,可以基于卫星遥感、无人机观测、路网分布等数据,对不同空间位置可能成为非法倾倒场地的概率进行预测;结合周边企业非法倾倒危废的概率预测结果,可以对非法倾倒行为进行快速预警和溯源。此外,基于机器学习算法建立企业环境违法概率预测模型则可以有效提升执法的精准性。当然,未来可以拓展的应用场景绝不限于此,需要更多的探索和研究将把这个领域带到一个新的水平。
3.3 公众参与监督场景
随着物联网、无人机、新社交媒体平台等技术的兴起,公众获取和传播数据信息的渠道变得更加便利。这缓解了传统环境治理中公众面临的信息不对称或信息壁垒现象,也提升了公众在环境治理体系中参与度和重要性。大数据,尤其是来自社交媒体的非结构化文本大数据,在追踪公众对热点环境问题的关注和态度方面得到了广泛应用。例如,kirilenko和stepchenkova(2014)基于推特数据解译了公众对气候变化问题的态度,并识别出了最具权威的推特用户和公众认为最权威的提供气候变化信息的组织。
此外,也有研究利用大数据测度公众对环境政策的响应。例如,wu等(2021)采用文本挖掘技术,基于新浪微博数据及其对相关热门帖子数据,测度了公众对城市生活垃圾分类政策情感和行为倾向。类似的数据和研究范式还被应用于测量公众对绿色建筑、装配式建筑等环境策略的响应(liu和hu,2019;wang等,2019)。
上述最新的研究展现了大数据在环境热点问题追踪、环境舆情引导与交流方面不可替代的优势。我们认为结合社交媒体等大数据,利用自然语言分析等技术,对环境的热点问题、热点区域、重点人群进行快速甄别与及时解决是未来研究值得关注的方向。
4
大数据用于我国环境治理实践的挑战与对策
我国高度重视大数据在环境治理中的潜力。国务院办公厅最早在2015年印发的《生态环境监测网络建设方案》中便指出要构建生态环境大数据平台,为生态环境保护决策、管理和执法提供数据支持。2016年,环保部正式印发《生态环境大数据建设总体方案》,进一步明确了生态环境大数据建设的目标。目前,大数据已经服务于我国环境质量预报预警、危废全生命周期追溯、工业园区智慧管理等多项实践。然而,进一步发挥大数据在我国环境治理中的实际效用还面临诸多挑战。本节总结归纳了在我国将大数据用于环境治理实践面临的挑战,并提出了针对性的解决策略。
第一,“垃圾输入,垃圾输出(gigo)”是大数据科学的黄金法则。许多研究领域的主体出于个人利益会自愿并积极地地提供尽可能真实的信息。例如,作为健康管理领域的主体,患者会提供尽可能真实、准确的信息来帮助疾病诊断和治疗。然而,环境领域的一个重要主体是企业。为了避免环境责任,企业往往倾向于避免自身数据被政府获得,或提供“合规数据”,而不是真实数据。因此,与其他领域相比,环境领域的大数据质量通常更差,并且有较高的数据造假可能性。当前用于环境治理实践的大数据来源多样、结构复杂,缺乏标准化的质量评估和控制。因此,在开展基于大数据的环境治理研究和实践前,通常需要花费数周或数月的时间清洗数据。面对这一巨大的挑战,数据共享在环境领域比在其他领域更为重要。建立一个开放访问的环境大数据共享社区一方面可以通过添加更多的数据来源来增加数据的体量和多样性,另一方面也可以实现不同来源数据质量的相互验证。更重要的是,通过这种方式研究者和政策制定者们可以通过共享数据使用经验来实现数据质量控制,避免因数据噪音而导致的错误决策。
第二,基于大数据的环境治理通常需要算法和工具的支持。研究者们通过引入人工智能等多学科交叉的算法和工具成功地将大数据用于环境污染、气候灾害预测、非法环境行为预警、环境舆情跟踪等众多领域。在实践中,基于大数据的环境治理需要管理者不断了解新的、跨学科的算法和工具。这显然是有难度的。这一定程度上阻碍了大数据在环境领域的深度应用。当前基于大数据的环境治理实践仍停留在环境数据采集和可视化阶段,主要通过人工判断或简单逻辑判断的方式转化为辅助监管和决策的信息。为了最大限度地发挥大数据的价值,需要强化智库建设,打通政府和科研机构的沟通渠道,促进科技成果向地方实践的快速转化。
第三,数据安全和隐私问题是所有大数据科学和实践都无法回避的挑战。因此,当前亟需对国内外相关法律法规、制度规范、标准指南等进行系统研究,识别我国当前环境领域大数据应用的监管空白,制定符合我国国情的环境大数据安全和隐私监管体系。