- 清洁与可再生能源研究:能源效率
- 胡松 胡平放 张燕平
- 4306字
- 2021-04-09 18:35:01
3.1 ANN模型的建立
3.1.1 人工神经网络简介
人工神经网络(Artificial Neural Network,ANN)是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型,它能够解决复杂的非线性实际问题,特别是难以建立精确数学模型的复杂问题[34]。
神经网络由大量的节点(或称神经元)相互连接而成,神经元是一个多输入、单输出的非线性信息处理单元。每个节点代表一种特定的输出函数,称为激励函数(activation function),常见的激励函数有阶跃型、S型和线性型。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称为权重,相当于人工神经网络的记忆[35]。
图3-1 三层前向BP人工神经网络
神经网络犹如一个“黑箱”模型,它不需要关于系统的详细信息,但是需要训练样本以学习输入和输出的非线性关系[36]。人工神经网络根据连接方式的不同有4种形式,分别为前向网络、有反馈的前向网络、层内有相互结合的前向网络以及相互结合型网络。其中,BP神经网络属于前向网络,它具有较强的非线性映射能力、泛化能力和容错能力[37],是目前应用最广泛的神经网络之一。本文采用BP人工神经网络,图3-1是典型的三层前向BP人工神经网络模型。
BP神经网络是一个前馈型神经网络,它包含输入层、中间层(也称隐含层)和输出层。它的特点是各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,进而构成具有层次结构的前馈型神经网络系统。
3.1.2 混合式地源热泵系统的ANN计算模型
1.热泵机组COP和系统COP
热泵机组COP和地源热泵系统COP是评价地源热泵系统的重要性能指标,现在的设计项目和实际工程中采用较多的是机组名义工况下的机组COP和系统COP,但是在系统实际运行过程中,由于热泵机组大多是在部分负荷下运行,热源温度不断变化,运行过程中操作不当或者设备部件出现故障都会造成系统性能的时刻改变,所以对系统进行实时监测并计算系统的评价指标对于系统的运行状况检查、节能性评价以及故障诊断等方面都有重要的意义。
夏季制冷工况下,机组运行过程中瞬时的性能系数COP为
式中:COP为夏季制冷工况下的机组性能系数;Q为夏季热泵机组制冷量,kW;N为热泵机组输入功率;ρ为水的密度,kg/m3;c为水的比热容,4.18kJ/(kg·K);m为热泵机组负荷侧水流量,m3/h;Tevap,in为蒸发器进口水温,℃;Tevap,out为蒸发器出水温,℃。
地源热泵系统性能系数为
式中:COPs为夏季制冷工况下的系统性能系数;Q为夏季热泵机组制冷量,kW;N为热泵机组输入功率;∑Ni为冷却水泵、冷冻水泵等其他耗能设备的输入功率;ρ为水的密度,kg/m3;c为水的比热容,4.18kJ/(kg·K);m为热泵机组负荷侧水流量,m3/h;Tevap,in为蒸发器进口水温,℃;Tevap,out为蒸发器出口水温,℃。
由式(3-1)和式(3-2)可知,计算机组COP至少需要检测N、m、Tevap,in、Tevap,out 4个基本运行参数,而计算COPs至少需要检测N、∑Ni、m、Tevap,in、Tevap,out6个基本运行参数。参考相关文献,热泵机组COP主要与蒸发器进出口水温、冷凝器进出口水温这4个温度高度相关。
制冷工况
制热工况
从上述章节可知,减少评价指标所需要的监测参数对监测条件不足、减少传感器安装数量、节省人力物力等方面都有重要的意义。因此为了检测最少的基本参数并尽量使用检测容易的基本参数,本文尝试用蒸发器进出口水温和冷凝器进出口水温这4个基本参数计算地源热泵系统的热泵机组COP和系统COP。
2.数学统计值
本文采用数学统计方法评价模型的计算准确度。
绝对误差ε为
相对误差δ为
均方根误差RMS(root-mean squared)为
方差R2(absolute fraction of variance)为
式中:xcalcu,m为ANN模型的计算值;xactual,m为实际值;n为数据个数。
绝对误差和相对误差越小则计算效果越好,模型越准确。方差R2的范围是0~1,其值越接近1则计算效果越好,模型越准确。均方根误差RMS为小于1的小数,其值越小则计算效果越好,模型越准确。
3.ANN模型的建立
(1)输入量和输出量的确定。ANN模型需要用数据样本对其进行训练和验证,本章数据样本来源为第2章基于TRNSYS软件模拟的夏季运行参数,由于模拟时将蒸发器进口水温设为定值12℃,所以本章建立的ANN计算模型是以蒸发器出口水温和冷凝器进出口水温3个参数为输入,以机组COP和系统COP为输出的三层前向BP人工神经网络,其结构示意图见图3-2。
图3-2 ANN性能评估计算模型
(2)训练样本和测试样本。本章数据样本来源为第2章基于TRNSYS软件模拟的夏季(6月1日到9月31日,每日8:00到18:00)一共1030组运行数据。从6月到9月共4个月每月随机抽取3天的运行数据作为训练样本,一共有113组数据。4个月所有的运行数据(包括113组训练数据)共1030组数据作为测试样本检验模型的准确性。
(3)传递函数。本模型隐含层传递函数选用S型的正切函数Tansig,输出层传递函数选用线性函数pureline。
(4)学习算法。BP神经网络的学习算法主要有启发式学习算法和优化算法。启发式学习算法是通过对表现函数梯度进行分析进而改进算法,包括自适应调整学习率lr的方法、增加动量因子的方法、同时增加动量因子和自适应调整学习率lr的方法和弹性梯度下降法。优化算法是基于数值最优化理论的训练算法,包括Levenberg-Marquardt方法、高斯-牛顿法和共轭梯度法[40]。如果内存足够,中小型网络可以采用Levenberg-Marquardt训练方法,因此本文BP网络模型采用的训练函数为trainlm。
(5)数据预处理。利用premnmx函数和tramnmx函数分别对训练样本输入和测试样本输入进行标准化处理,使其在0~1范围内,输出不作处理。
(6)改进BP学习算法。在实际应用中BP算法存在两个重要问题,收敛速度慢和目标函数存在局部极小点。因此本文采取增加动量项和自适应调节学习率等改进措施[41]。增加的主要程序如下:
(7)隐层数及隐层节点数的设计。理论分析证明,具有单隐层的BP神经网络可以映射所有连续函数。设计时一般先考虑设1个隐层,当1个隐层的隐节点数仍不能改善网络性能时才考虑再增加1个隐层,因此本章设定1个隐层。隐节点的作用是从样本中提取并储存其内在规律。隐节点数量太少则网络从样本中获取信息的能力较差,不足以概括和体现训练集中的样本规律;隐节点数量过多又可能把样本中非规律性的内容如噪声等存储,从而出现过度吻合问题,降低系统的泛化能力。此外隐节点数太多还会增加训练时间。本文采取试凑法和经验公式计算隐节点个数方法相结合,确定隐含层节点个数的大致范围[42-43]。
式中:m为隐层节点数;n为输入层节点数;l为输出层节点数;α为0~10之间的常数;t为训练样本数据组数。
本文ANN模型是利用MATLAB中提供的神经网络工具箱,在MATLAB7.0环境中编写程序建立的。
主要训练程序如下:
[Input,mintraininput,maxtraininput]=premnmx(traininput);%对输入做标准化处理
net=newff(minmax(Input),[14,1],{′tansig′,′purelin′},′trainim′);%创建一个神经网络
net.trainParam.epochs=5000;%设定最大训练次数为5000次
net.trainParam.goal=1E-06;%训练要求精度为1E-06
[net,tr]=train(net,Input,t);%网络训练
save net%保存该网络
主要的测试程序如下:
[Testinput]=tramnmx(testinput,mintraininput,maxtraininput);
%对输入做标准化处理
load net %调用已训练好的网络
output=sim(net,Testinput);%得到网络输出值
3.1.3 ANN计算模型的训练及测试
1.抽取113组数据作为训练样本
模型训练和测试样本来自第2章基于TRNSYS软件模拟得到制冷工况下(6月1日到9月31日,每日8:00到18:00)运行数据一共1030组。从6月到9月共4个月每月中随机抽取3天的运行数据作为训练数据,一共有113组数据。4个月所有的运行数据(包括113组训练数据)作为测试数据检验模型的准确性。模型隐含层传递函数选用S型的正切函数Tansig,输出层传递函数选用线性函数pureline,隐含层节点个数取14,选用的训练算法为trainlm,设定训练次数为5000次,训练精度为1E-06,其他参数均采用默认值。对输入数据作了标准化处理,使其在0~1范围内,输出不作处理。
机组COP测试结果为:RMS=0.045890063,R2=0.999872059,相对误差δ见图3-3。系统COP测试结果为:RMS=0.037994188,R2=0.999898664,相对误差δ见图3-4。
图3-3 机组COP的ANN模型计算值的相对误差
图3-4 系统COP的ANN模型计算值的相对误差
由图3-3及图3-4可以看出,无论机组COP还是系统COP,误差较大的数据组均集中在7月、8月,原因为7月、8月武汉温度较高,且土壤有了一定的热积累,导致地源热泵系统运行效率降低,热泵机组的COP值在整个夏季过程中处于相对偏低状态。而ANN模型的测试数据随机取自每个月3天一共113组数据,样本选取不够多样性和均匀性,使ANN模型未能充分获取不同类别样本的规律信息。除了部分测试误差较高之外,其他误差均在可接受范围内,可见仅以蒸发器出口水温、冷凝器进出口水温3个参数作为输入量的ANN模型可以较准确地计算出地源热泵系统的机组COP和系统COP。
2.抽取133组数据作为训练样本
为了改善上述情况,另多加7月和8月各1天的运行数据作为训练样本。一共为133组数据。4个月所有的运行数据共1030组作为测试数据检验模型的准确性。为了减少训练时间,将训练次数改为1000次,经反复测试验证,将训练次数由5000次改为1000次对测试结果精度影响不大。模型隐含层传递函数选用S型的正切函数Tansig,输出层传递函数选用线性函数pureline,选用的训练算法为trainlm,训练精度为1×10-6,其他参数均采用默认值。对输入数据作了标准化处理,使其在0~1范围内,输出不作处理。
依据经验公式(3-9)~式(3-11)可得隐含层节点数范围为2~13。隐含层选取的不同节点个数的ANN模型机组COP和系统COP的测试样本均方根误差见图3-5。
图3-5 隐含层不同节点个数ANN模型测试均方根误差
由图3-5可知,ANN模型具有较高的计算精度。无论机组COP还是系统COP,ANN模型的测试均方根误差均小于0.04。对于机组COP,随着隐层节点个数的增加,一开始ANN模型测试RMS呈平缓趋势,当隐含层节点个数大于10时,ANN模型测试RMS呈上升趋势,这是因为隐节点数量过多,可能把样本中非规律性的内容如噪声也存储起来,从而出现过度吻合问题,反而降低了系统的泛化能力。对于系统COP,随着隐含节点个数的增加,ANN模型测试RMS先降低后增加,最佳隐含层节点个数为8。当隐含层节点个数为8时,ANN模型的机组COP测试RMS也相对较小。所以综合考虑,隐含层节点个数为8的ANN模型为最佳模型。
最优模型机组COP测试结果、绝对误差和相对误差分别见图3-6~图3-8;系统COP测试结果、绝对误差、相对误差分别见图3-9、图3-10和图3-11。
热泵机组COP测试结果为RMS=0.028645274,R2=0.999950581。由图3-7可知,ANN模型计算值与真实值之间的绝对误差在-0.055~0.103之间;由图3-8可知,其相对误差在-1.2%~2.55%之间,相对误差全部在1%的数据有1010组,占总数的98%。可见计算准确度很高。
图3-6 机组COP ANN模型计算值与真实值比较
图3-7 机组COP ANN模型计算值的绝对误差
图3-8 机组COP ANN模型计算值的相对误差
图3-9 系统COP ANN模型计算值与真实值的比较
地源热泵系统COP的测试结果为RMS=0.030840231,R2=0.999933233。由图3-10可知,ANN模型计算值与真实值之间的绝对误差在-0.160~0.164之间;由图3-11可知,其相对误差在-3.9%~4.4%之间,相对误差全部在2%之内的数据有1008组,占总数的97.9%。由此可见由蒸发器出口温水、冷凝器进出口水温3个参数作为输入的ANN计算模型经过训练后可较准确地计算出地源热泵机组COP和地源热泵系统COP。
图3-10 系统COP ANN模型计算值的绝对误差
图3-11 系统COP ANN模型计算值的相对误差