MBR中膜污染的人工神经网络预测研究进展
Research progress of artificial neural network for membrane fouling prediction in MBR
收稿日期: 2022-03-09
基金资助: |
|
Received: 2022-03-09
作者简介 About authors
张浩良(1996—),硕士研究生E-mail:
王侃鸣,博士E-mail:
关键词:
Keywords:
本文引用格式
张浩良, 刘聪, 洪乾坤, 王侃鸣, 王红宇.
ZHANG Haoliang.
机器学习(Machine learning,ML)是一种基于以往经验或数据进行分类与回归的技术,不仅被运用于农业、气候、安全、教育、医学等行业〔4〕,也被广泛运用于污水处理领域。人工神经网络(Artificial neural network,ANN)作为一种机器学习模型,不仅具有参数少、预测性能好、泛化能力强等优点〔5〕,而且具有极强的非线性映射能力、学习能力和黑箱建模能力。因此,应用ANN模型进行膜污染预测无需考虑复杂的膜污染中间过程,只需考虑与膜污染相关的指标即可。石宝强等〔6〕早在2006年就综述了ANN在MBR膜污染预测中的应用研究,但是随着对MBR膜污染机理的深入研究和ANN模型理论与技术的发展,亟需新的综述对近年来的研究进行总结。而F. SCHMITT等〔7-8〕虽然综述了人工智能用于预测膜污染的研究,但是欠缺对传统数学模型与神经网络模型差异的深入分析。基于此,笔者简述了影响膜污染的因素,对比了传统数学模型与人工神经网络模型的差异与优劣,总结了近年来ANN模型在膜污染预测中的应用及优缺点,并对其未来的发展进行了展望。
1 膜污染的影响因素
图1
早期研究人员建立了关于操作条件、膜通量、过滤滤阻等参数的数学模型〔11-15〕。此后,有研究建立了表达污泥混合液特性〔例如混合液悬浮固体浓度(Mixed liquid suspend solids,MLSS)、颗粒粒径(Particle size distribution,PSD)、溶解性微生物产物(Soluble microbial products,SMP)等〕与膜污染关系的数学模型〔16-18〕。但是,这些传统的数学模型一般为指数式经验模型,往往需要通过诸多假设来简化计算,且各参数物理意义不明确,存在预测精度低和通用性差等问题〔6-7〕。因此,开发能够更加精准预测膜污染的模型对膜污染控制及其机理研究有重要意义。
膜污染模型的构建需要选择合适的影响因子作为输入变量,并寻找变量与膜污染之间的关系。因此,厘清各膜污染因素之间的相互作用及其对膜污染的影响是构建膜污染预测模型的前提条件。
1.1 膜材料性质
1.2 操作参数
不同的MBR系统操作条件也会影响膜污染,主要包括进水水质、运行温度、SRT、HRT、错流流速和曝气强度等。SRT与HRT是影响MBR处理效能、污泥混合液特性和膜污染的重要因素。一般认为SRT的增加会降低污泥活性和絮体大小,此外较长的SRT促进了内源性衰变和细胞裂解,导致SMP的增加〔22〕。例如,在厌氧MBR的研究中,Zhi HUANG等〔23〕比较了不同SRT(30 d、60 d、∞)对膜污染的影响,结果表明在较长的SRT下厌氧MBR中会积累较多的蛋白质与多糖,MLSS增加,从而增加了膜污染速率。对于HRT而言,较短的HRT会导致有机负荷的增加,从而导致微生物分泌更多的胞外聚合物(Extracellular polymeric substances,EPS)和SMP,从而提升膜污染速率。例如,N. FALLAH等〔24〕比较了不同HRT对膜污染的影响,结果表明随着HRT的降低,EPS和SMP显著增加,污泥混合液的黏度也显著增加,导致了较高的膜污染速率。此外,通过在膜表面增加错流流速和曝气强度等物理剪切方式,减少颗粒物在膜表面的沉积也是减缓膜污染的常见方法。Yingyu AN等 〔25〕在厌氧MBR中发现,一定范围内增加含甲烷生物气曝气强度能够减缓膜污染,但是过高的曝气强度会破坏污泥絮体,导致污泥颗粒平均粒径降低,从而更易形成致密的膜污染层,同时膜污染速率也会提高。
1.3 污泥混合液特性
2 膜污染预测模型的相关研究
2.1 经典数学模型
在过去几十年里,研究人员相继构建了表达污泥混合液特性和运行条件等与膜污染关系的经验公式,并建立了经典数学模型,其部分代表性成果见表1。
表1 几种经典预测膜污染数学模型
Table 1
尽管经典数学模型在膜污染预测方面取得了一定的成果,但是膜污染是一个受进水特性、微生物活动、过滤模式等多因素影响的复杂动态过程,这些经典数学模型往往为了简化仅考虑部分影响因素或在建立模型过程中设置诸多假设,例如,基于串联阻力定律的预测模型虽然有广泛的应用,但并没有考虑生物膜的生长和不可逆污染物的形成等作用对膜污染的影响〔28〕,因而在实际应用中不可避免会存在一定的误差。
2.2 机器学习常见算法
表2 机器学习常见算法及优缺点
Table 2
类别 | 特征 | 应用 | 优点 | 缺点 |
---|---|---|---|---|
随机森林 | 以决策树为基学习器的集成学习算法 | 分类与回归 | 本身精度优于单个算法; 可以处理离散型和连续值; 测试数据集速度较快 | 多个决策树时,训练所需时间和空间较大; 噪音较大的样本容易过拟合; 忽略了数据之间的相关性 |
邻近算法 | 靠有限的邻近的样本学习 | 分类与回归 | 训练速度快; 对数据没有假设,准确度高 | 计算量过大; 可理解性差; 对训练数据的依赖性较大 |
支持向量机(SVM) | 利用二次规划求解支持向量 | 分类与回归 | 使用核函数可以解决非线性问题; 分类效果较好 | 对大规模训练样本难以实施; 解决多分类问题存在困难; 对缺失数据敏感,对参数和核函数选择敏感 |
神经网络 | 用于处理难以解释内部规律的问题 | 分类与回归 | 具有很强的泛化能力; 高速寻找最优解的能力; 具有自学习功能 | 无法解释其推理过程及依据; 学习参数、权值较多; 学习时间较长 |
线性回归 | 用直线较为精确地描述数据之间的关系 | 回归 | 对数据关系简单、量小效果较好; 是许多非线性回归模型的基础; 易于理解,有利于决策分析 | 对非线性或关系复杂数据难以建模 |
由表2可知,机器学习能够弥补传统的数学模型预测精度低、实际应用效果差等缺点〔29-33〕。目前机器学习已被运用到MBR膜污染的研究中,不少学者使用随机森林、SVM和多元回归等来建立与膜污染相关的预测模型。随机森林是一种以决策树为基学习器的集成算法,李威威等〔31〕采用随机森林算法预测膜通量,通过模型计算得到的预测值与真实值的平均误差仅3.98%。SVM具有的核函数可以解决非线性问题,梁楷〔32〕基于SVM建立的膜污染预测模型有效地预测了膜通量,平均误差仅为2.63%。多元回归能选取自变量的最优组合共同预测因变量,Zhan WANG等〔33〕通过多元回归建立了化学清洗模型,通过模型预测通量恢复率,对减缓膜污染起到了指导性作用。尽管以上机器学习算法能够在膜污染预测方面获得较高的预测精度,但是仍然存在一定的局限性,例如,虽然随机森林对数据集的适应能力很强并具有较快的运算速度,但其往往忽略数据集之间的相关性,导致预测精度下降。
鉴于膜污染过程的复杂性和非线性,简单的机器学习只能粗略表示变量之间的关系,无法取得较高的预测精度。近年来,由于ANN能够通过学习非线性的复杂关系来构建数学模型,并且具有较强的泛化能力,对未知数据具有较好的预测效果,因此,部分学者逐渐将其应用于膜污染的预测。对Web of Science上2006年至2020年运用ANN算法研究膜污染的文献数量进行统计,结果见图2。
图2
图2
2006—2020年Web of Science上ANN-膜污染文献数量
Fig. 2
Numbers of ANN-membrane fouling papers on Web of Science (2006—2020)
由图2可知,从2016年开始,关于ANN在膜污染方面研究的文献数量迅速增加,可见ANN已经成为研究膜污染预测及控制的重要工具。
2.3 人工神经网络算法
ANN是一种模仿动物神经网络行为特征进行分布式并行信息处理的算法。其简单拓扑图见图3。
图3
如图3所示,ANN信息处理功能的实现主要依靠神经节点的输入输出、神经元的阈值及连接权值大小的调整。ANN的预测性能可以通过均方根误差(Root mean square error,RMSE)、决定系数R2、相对误差Error等参数来评估,其计算分别见公式(
公式(
ANN预测模型的另一个功能是预测膜污染并运用敏感性分析来识别影响膜污染的关键因素。例如A. R. ALKMIM等〔36〕运用多层感知器神经网络(Mutilayer perception neural networks,MLPNN)对膜透水率进行预测,R2可以达到0.964,且计算得出混合液挥发性悬浮固体浓度(Mixed liquid volatile suspended solids,MLVSS)对膜透水率的变化贡献最大。H. HAZRATI等〔37〕利用反向传播神经网络(Back propagation neural networks,BPNN)模型对TMP进行预测,其R2=0.999,且发现MLSS、HRT和运行时间3个变量均对TMP具有较大的影响。
2.4 人工神经网络算法的分类及在膜污染中的应用
图4
图4
人工神经网络分类及占比
Fig.4
Classification and percentage of artificial neural network
表3 2016—2020年ANNs在膜生物反应器膜污染模拟的应用
Table 3
目前在MBR膜污染预测中常用的简单人工神经网络主要有MLPNN、BPNN和径向基函数神经网络(Radical basis function neural networks,RBFNN)等。这些简单神经网络均包括输入层、隐藏层、输出层,但是又各具特点。MLPNN的不同层之间采用全连接的方式传递结果;BPNN的输出结构采用前向传播方式,误差采用反向传播方式进行;RBFNN则采用径向基函数作为激活函数,它的输出是输入的径向基函数和神经元参数的线性组合。大量研究证明基于简单ANN的预测模型具有较高的预测精度,例如F. SCHMITT等〔39〕在AO-MBR中利用MLPNN预测TMP,并构建进水水质(总氮、总磷、硝酸盐)与TMP的模型关系,其R2为0.850。尽管简单人工神经网络在膜污染预测方面具有较高的精度,但是仍存在拟合时间长、参数众多且无法解决某些最优化问题等缺点。
在简单神经网络基础上结合优化算法,能够通过改善训练方式来最小/最大化损失函数,具有加快神经网络训练速度、快速寻找参数最优值以及提高模型预测精度等优点。应用于膜污染预测的常见优化算法包括遗传算法(Genetic algorithm,GA)和粒子群算法(Particle swarm optimization,PSO)等。其中,GA是基于生物体进化规律模型化问题的求解过程,具有优越的优化性能,被广泛运用于机器学习和信号处理等领域〔44〕。S. A. MIRBAGHERI等〔45〕采用MLPNN预测TMP及膜透水率,并用GA算法对权值进行优化,结果证实优化后的模型具有更高的预测精度。PSO则是一种基于智能体的仿生优化算法,在求解全局最优解方面具有较大的优势,可以完成神经网络连接权值的训练、结构设计和特征选择等。刘志峰等〔46〕研究了一种PSO-BPNN,用粒子群算法代替传统的梯度下降算法,结果表明优化后的模型具有更高的预测准确度,平均误差从2.35%下降至0.83%。但是,结合优化算法模型的建立与参数优化过程需要耗费大量的时间,限制了其的广泛应用。
此外,简单ANN和结合优化算法的ANN的预测性能高度依赖于样本量,并且在训练过程中往往会陷入局部最优状态,从而导致模型的预测稳定性较差。近年来,DLNN由于能够有效弥补简单ANN和结合优化算法ANN的不足,并挖掘数据的深度信息而被广泛研究,其主要包括深度置信网络(Deep belief network,DBN)、卷积神经网络(Convolutional neural networks,CNN)、堆叠式自动编码器(Stacked auto-encoders,SAE)网络等。通常,DLNN是一种可以有效而灵活地表达高度变化的非线性的算法,具有强大的学习能力和非线性映射能力〔47〕。Honggui HAN等〔43〕开发了一种基于自组织深度置信网络(Self-organizing deep belief network,SDBN)的膜透水率的预测方法,这种方法可以通过调整模型结构及参数提高模型预测精度,与简单ANN相比,该模型具有更高的精度(RMSE为0.872)。在一些情况下,深度神经网络的预测效果可能比结合优化算法的ANN更佳。Shuai SHI等〔48〕基于堆叠降噪自动编码器(Stacked denoising auto-encoders,SDAE)深度学习神经网络建立了MBR的性能预测模型,结果发现与GA-BPNN模型相比,其具有更高的R2及更低的均方误差(Mean square error,MSE)。尽管深度学习神经网络具有更高的预测精度,但是目前使用深度神经网络在MBR中进行建模的研究相对较少,其原因可能是一方面深度学习神经网络的复杂性较高,模型构建的时间远超简单ANN,另一方面使用简单ANN已经可以满足大多数的研究任务。
综上所述,目前在MBR膜污染预测模型中,简单神经网络因高预测精度与高效性,在短时间内仍然是研究人员运用的主流工具。但是,随着优化算法的运用以及深度神经网络的开发,结合优化算法的ANN与深度学习ANN在面对更复杂环境下更具优势,有望替代简单神经网络成为未来研究膜污染预测模型的主要工具。
2.5 ANN在中试MBR膜污染预测中的应用
虽然研究已经证实ANN在MBR膜污染预测上具有较高的性能,但是由于技术设备规模与废水特性的差异,实验室小试规模反应器的操作参数往往与实际的大规模反应器有明显的区别,因此,推动ANN在中试规模MBR膜污染中的预测研究意义重大。Y. J. CHOI等〔49〕收集了中试规模的浸没式MBR的长期运行数据,并构建了膜化学清洗后的通量、膜过滤时间及进水水质与膜透水率间的ANN模型,该模型R2可达0.950,实现了在中试规模下对MBR膜污染的精准预测。尽管如此,目前相关研究仍大多停留于小试阶段,在针对实际废水的中试MBR以及污水处理厂中应用依然较少。因此亟需根据中试及实际污水处理厂长期运行的数据建立ANN膜污染预测模型,从而更加精准地预测实际污水处理中MBR的膜污染状况。
3 结论与展望
目前,膜污染仍然是阻碍MBR广泛应用的瓶颈性问题,近年来,ANN模型因变量简单、预测精度高等优点被用于MBR膜污染的预测。但是研究表明,ANN模型用于MBR膜污染预测研究仍存在以下缺陷,是未来研究的重要方向:
(1)ANN本质上属于“黑箱”模型,目前由于神经网络结构的特殊性难以对中间过程进行解释。因此,未来的研究可以侧重于通过解析神经网络的复杂结构来厘清影响因子对膜污染的具体作用。
(2)ANN模型存在权值多、建模过程长等缺陷。因此未来膜污染预测模型的发展趋势是优先使用更多优化的线性和非线性数据分析方法对数据进行降维或特征提取,从而减少数据的复杂程度,进而提高模型预测的精度并减少建模时间。
(3)目前ANN模型应用于中试和工业化规模的MBR膜污染预测较少,亟需基于长期实际运行的数据建立ANN膜污染预测模型,构建完备的预测体系,为调整污水处理厂运行操作条件提供技术支持,进而提高其运行效率、减缓膜污染并降低污水处理成本。
参考文献
A/O-生物膜系统处理煤化工废水
[J].
Treatment of coal chemical industry wastewater by an A/O-biofilm pilot system
[J].
Fouling in membrane bioreactors:An updated review
[J].
Critical review of fouling mitigation strategies in membrane bioreactors treating water and wastewater
[J].
Tackling environmental challenges in pollution controls using artificial intelligence:A review
[J].
Applications of artificial neural networks for adsorption removal of dyes from aqueous solution:A review
[J].
人工神经网络在膜生物反应器膜污染预测中的应用前景
[J].
Prospect of artificial neural network in the study of membrane fouling in membrane bioreactor
[J].
Prediction of membrane fouling using artificial neural networks for wastewater treated by membrane bioreactor technologies:Bottlenecks and possibilities
[J].
Advanced control of membrane fouling in filtration systems using artificial intelligence and machine learning techniques:A critical review
[J].
MBR膜污染的形成及其影响因素研究进展
[J].
Progress of MBR membrane fouling formation and its influence factors
[J].
Recent advances in membrane bioreactors(MBRs):Membrane fouling and membrane material
[J].
中空纤维膜的膜污染过程及数学模型研究进展
[J].
Review of membrane fouling stages and mathematical models for hollow fiber membrane
[J].
Characterization of fouling kinetics in ultrafiltration systems by resistances in series model
[J].
The effect of fibre diameter on filtration and flux distribution—Relevance to submerged hollow fibre modules
[J].
Optimization model of submerged hollow fiber membrane modules
[J].
Constant pressure blocking filtration laws-application to power-law non-Newtonian fluids
[J].
New and practical mathematical model of membrane fouling in an aerobic submerged membrane bioreactor
[J].
Effects of activated sludge properties on water flux of ultrafiltration membrane used for human excrement treatment
[J].
Identification of activated sludge properties affecting membrane fouling in submerged membrane bioreactors
[J].
Recent advances in membrane bioreactors (MBRs):Membrane fouling and membrane material
[J].
Comparison of filtration and treatment performance between polymeric and ceramic membranes in anaerobic membrane bioreactor treatment of domestic wastewater
[J].
Recent development in modification of polysulfone membrane for water treatment application
[J].
Comparison of fouling between aerobic and anaerobic MBR treating municipal wastewater
[J].
Submerged anaerobic membrane bioreactor for low-strength wastewater treatment:Effect of HRT and SRT on treatment performance and membrane fouling
[J].
Long-term operation of submerged membrane bioreactor(MBR) for the treatment of synthetic wastewater containing styrene as volatile organic compound(VOC):Effect of hydraulic retention time(HRT)
[J].
Post-treatment of upflow anaerobic sludge blanket effluent by combining the membrane filtration process:Fouling control by intermittent permeation and air sparging
[J].
中空纤维膜生物反应器污泥特性与可持续通量评估
[J].
Assessment of sludge properties and sustainable flux in hollow fiber membrane bioreactor
[J].
A review on anaerobic membrane bioreactors(AnMBRs) focused on modelling and control aspects
[J].
膜生物反应器膜污染的随机森林预测模型
[J].
Prediction model for mambrane bio-reactor fouling based on random forest
[J].
基于模拟退火算法的支持向量机在MBR膜污染中的应用研究
[D].
Application of Support Vector Machine based on simulated annealing algorithm in MBR membrane fouling
[D].
Influence of various operating conditions on cleaning efficiency in sequencing batch reactor(SBR) activated sludge process. Part V:Chemical cleaning model
[J].
Influence of salinity on the biological treatment of domestic ship sewage using an air-lift multilevel circulation membrane reactor
[J].
Modeling of membrane bioreactor treating hypersaline oily wastewater by artificial neural network
[J].
Improving knowledge about permeability in membrane bioreactors through sensitivity analysis using artificial neural networks
[J].
The influence of hydraulic retention time on cake layer specifications in the membrane bioreactor:Experimental and artificial neural network modeling
[J].
A practical hybrid modelling approach for the prediction of potential fouling parameters in ultrafiltration membrane water treatment plant
[J].
Development of artificial neural networks to predict membrane fouling in an anoxic-aerobic membrane bioreactor treating domestic wastewater
[J].
Prediction of interfacial interactions related with membrane fouling in a membrane bioreactor based on radial basis function artificial neural network(ANN)
[J].
New deterministic tools to systematically investigate fouling occurrence in membrane bioreactors
[J].
改进的神经网络及CFD在MBR模拟仿真中的应用研究
[D].
Application of improved neural network and CFD in MBR simulation
[D].
Data-driven decision-making for wastewater treatment process
[J].
Evaluation and prediction of membrane fouling in a submerged membrane bioreactor with simultaneous upward and downward aeration using artificial neural network-genetic algorithm
[J].
PSO-BP神经网络在MBR工艺中的膜污染预测
[J].
Flux prediction of MBR based on PSO-BP neural network
[J].
Transfer learning using computational intelligence:A survey
[J].
Novel performance prediction model of a biofilm system treating domestic wastewater based on stacked denoising auto-encoders deep learning network
[J].
Investigation of the filtration characteristics of pilot-scale hollow fiber submerged MF system using cake formation model and artificial neural networks model
[J].