
文章信息
译名:废水处理中的深度学习:批判性综述
2023年影响因子:12.8
5年影响因子:12.8
在线发表时间:2023.12
通讯作者:Maira Alvi
第一单位:Department of Computer Science & Software Engineering, The University of Western Australia, Australia
文章亮点
以过程为中心的机理模型被广泛使用,但特定于应用。
深度学习 (DL) 在预测、控制、传感和数据分析方面有应用。
深度学习需要大量数据,缺乏高质量的数据集是训练的一个关键问题。
通过迁移学习和未拟合的机理模型改进训练。

01研究背景
现代污水处理厂代表了上个世纪最伟大的公共卫生进步之一。它们通过在环境排放之前去除病原体、污染物和营养物质,在保护生态系统和保障人类健康方面发挥着重要作用。现代处理设施包括多个单元操作,依赖于许多物理、生物和化学机制,并受到大量的外部动态干扰、强非线性、不同过程和治疗目标的广泛变化的系统时间常数。处理设施是资本密集型的民用基础设施,用途不灵活,高度容易受到局部气候变化的影响,其成本在很大程度上取决于有效流程和单元操作的选择。在研究和实践中,机器辅助资产设计和优化非常受关注。此外,废水处理过程数据丰富,具有强大的研究支持,并且通常具有从研究到工程实践的良好历史。
02研究方案
深度学习是一种基于人工神经网络(ANN)的技术,其松散地受到人脑生物处理单元的启发。这些算法中最简单的处理单元称为神经元或感知器。当这些单元以分层方式分层排列时,它们会形成深度神经网络,其中深度是指层数。这些层通过激活函数连接,激活函数基本上通过连续和不连续函数打开或关闭连接。神经元之间连接的权重决定了模型响应。训练深度学习网络涉及调整一系列输入和输出的权重,以优化神经元权重,从而最大限度地提高深度学习模型针对给定输入预测的输出的准确性。
03研究结果
DBN 等无监督深度学习方法与一类 SVM 相结合,可有效进行故障检测。此外,基于残差神经网络 (ResNet) 的深度变分自动编码器 (VAE) 被应用于缺失数据插补和传感器自我验证。ResNet-VAE框架的集成在从膜生物反应器数据中提取复杂特征和克服梯度消失问题方面具有优势。VAE-ResNet方法在检测和重建故障传感器以及插补缺失值方面表现出更高的性能。平均绝对百分比误差 (MAPE) 在 3.98% 至 10.44% 之间变化。然而,应该指出的是,虽然 ResNet 在分类和计算机视觉任务方面表现出色,但其计算资源需求,主要是由于其深层结构,引发了人们对其在简单回归任务(例如废水系统中发现的任务)的可行性的担忧。正如Dairi等人所强调的那样,WWTP中异常检测的另一种建议方法是将RNN和受限玻尔兹曼机(RNN-RBM)与分类器耦合。这些深度学习技术为增强污水处理行业的故障检测、诊断和缺失数据插补提供了有希望的途径。在这一领域的持续研究和开发可以使污水处理厂的决策过程更加准确和高效。

Fig. 1. Illustration of an artificial neuron or perceptron in a standard ANN. A weighted sum is computed via linear combination of inputs features by weights of parameters alongside a scalar bias term. Afterwards, the output is computed by application of non-linear function called an ‘activation function’ (e.g., rectified linear unit (ReLU)) to the weighted sum.

Fig. 2. Illustration of a training loop in a deep neural network. Initially, the model parameters (weights) are initialized to random values. Then the weights are adjusted iteratively over training samples by an optimizer with the aim of minimizing the loss score of the difference between the predicted and actual outputs.

Fig. 3. Illustration of a workflow to build a Deep learning model. The raw data is pre-processed and afterwards split to train, validation, and test sets. The training data is used to train a model while validation data evaluate model performance and aid to tune hyper-parameters. Finally, the best model is evaluated over unseen test data to estimate real-world performance.
03研究结论
本文介绍了深度学习在废水系统中的广泛应用,包括系统表示、过程控制、软传感以及数据质量和聚合。在计算机辅助设计、设计空间探索和混合建模(机理-经验模型)方面发现了更多的机会。已经确定了许多实际挑战,包括数据质量和数量、深度学习模型的不透明性以及模型鲁棒性。特别是,深度学习需要大量高质量的样本来描述感兴趣过程的经验分布。虽然开放数据集的可用性越来越高,但质量、过程变量的范围,尤其是与之相关的解释性元数据至关重要。深度学习还需要开发高级算法来确定其鲁棒性,并且需要方法来解释神经网络中的决策流。其他研究方向包括一个强大且可重复的特征选择框架,以及使用迁移学习和使用机理模型在系统之间转移模型的能力。
原文链接:
https://www.sciencedirect.com/science/article/pii/S0043135423009582
黑龙江林口稻蟹科技小院
培养单位:东北农业大学
联合培养单位:黑龙江省林口县农业农村局
版权所有 全国农业专业学位研究生教育指导委员会 版权所有 Copyright © All Rights Resserved 京ICP备 05004632号-3

文章信息
译名:废水处理中的深度学习:批判性综述
2023年影响因子:12.8
5年影响因子:12.8
在线发表时间:2023.12
通讯作者:Maira Alvi
第一单位:Department of Computer Science & Software Engineering, The University of Western Australia, Australia
文章亮点
以过程为中心的机理模型被广泛使用,但特定于应用。
深度学习 (DL) 在预测、控制、传感和数据分析方面有应用。
深度学习需要大量数据,缺乏高质量的数据集是训练的一个关键问题。
通过迁移学习和未拟合的机理模型改进训练。

01研究背景
现代污水处理厂代表了上个世纪最伟大的公共卫生进步之一。它们通过在环境排放之前去除病原体、污染物和营养物质,在保护生态系统和保障人类健康方面发挥着重要作用。现代处理设施包括多个单元操作,依赖于许多物理、生物和化学机制,并受到大量的外部动态干扰、强非线性、不同过程和治疗目标的广泛变化的系统时间常数。处理设施是资本密集型的民用基础设施,用途不灵活,高度容易受到局部气候变化的影响,其成本在很大程度上取决于有效流程和单元操作的选择。在研究和实践中,机器辅助资产设计和优化非常受关注。此外,废水处理过程数据丰富,具有强大的研究支持,并且通常具有从研究到工程实践的良好历史。
02研究方案
深度学习是一种基于人工神经网络(ANN)的技术,其松散地受到人脑生物处理单元的启发。这些算法中最简单的处理单元称为神经元或感知器。当这些单元以分层方式分层排列时,它们会形成深度神经网络,其中深度是指层数。这些层通过激活函数连接,激活函数基本上通过连续和不连续函数打开或关闭连接。神经元之间连接的权重决定了模型响应。训练深度学习网络涉及调整一系列输入和输出的权重,以优化神经元权重,从而最大限度地提高深度学习模型针对给定输入预测的输出的准确性。
03研究结果
DBN 等无监督深度学习方法与一类 SVM 相结合,可有效进行故障检测。此外,基于残差神经网络 (ResNet) 的深度变分自动编码器 (VAE) 被应用于缺失数据插补和传感器自我验证。ResNet-VAE框架的集成在从膜生物反应器数据中提取复杂特征和克服梯度消失问题方面具有优势。VAE-ResNet方法在检测和重建故障传感器以及插补缺失值方面表现出更高的性能。平均绝对百分比误差 (MAPE) 在 3.98% 至 10.44% 之间变化。然而,应该指出的是,虽然 ResNet 在分类和计算机视觉任务方面表现出色,但其计算资源需求,主要是由于其深层结构,引发了人们对其在简单回归任务(例如废水系统中发现的任务)的可行性的担忧。正如Dairi等人所强调的那样,WWTP中异常检测的另一种建议方法是将RNN和受限玻尔兹曼机(RNN-RBM)与分类器耦合。这些深度学习技术为增强污水处理行业的故障检测、诊断和缺失数据插补提供了有希望的途径。在这一领域的持续研究和开发可以使污水处理厂的决策过程更加准确和高效。

Fig. 1. Illustration of an artificial neuron or perceptron in a standard ANN. A weighted sum is computed via linear combination of inputs features by weights of parameters alongside a scalar bias term. Afterwards, the output is computed by application of non-linear function called an ‘activation function’ (e.g., rectified linear unit (ReLU)) to the weighted sum.

Fig. 2. Illustration of a training loop in a deep neural network. Initially, the model parameters (weights) are initialized to random values. Then the weights are adjusted iteratively over training samples by an optimizer with the aim of minimizing the loss score of the difference between the predicted and actual outputs.

Fig. 3. Illustration of a workflow to build a Deep learning model. The raw data is pre-processed and afterwards split to train, validation, and test sets. The training data is used to train a model while validation data evaluate model performance and aid to tune hyper-parameters. Finally, the best model is evaluated over unseen test data to estimate real-world performance.
03研究结论
本文介绍了深度学习在废水系统中的广泛应用,包括系统表示、过程控制、软传感以及数据质量和聚合。在计算机辅助设计、设计空间探索和混合建模(机理-经验模型)方面发现了更多的机会。已经确定了许多实际挑战,包括数据质量和数量、深度学习模型的不透明性以及模型鲁棒性。特别是,深度学习需要大量高质量的样本来描述感兴趣过程的经验分布。虽然开放数据集的可用性越来越高,但质量、过程变量的范围,尤其是与之相关的解释性元数据至关重要。深度学习还需要开发高级算法来确定其鲁棒性,并且需要方法来解释神经网络中的决策流。其他研究方向包括一个强大且可重复的特征选择框架,以及使用迁移学习和使用机理模型在系统之间转移模型的能力。
原文链接:
https://www.sciencedirect.com/science/article/pii/S0043135423009582
版权所有 全国农业专业学位研究生教育指导委员会
版权所有 Copyright © All Rights Resserved
京ICP备 05004632号-3