论文网
首页 理科毕业设计毕业正文

应用于AQM的神经网络PID控制器优化设计

  • 投稿图诺
  • 更新时间2015-09-23
  • 阅读量1013次
  • 评分4
  • 85
  • 0

周雪寒

(桂林电子科技大学,广西 桂林 541004)

【摘要】主动队列管理(AQM)在解决网络拥塞问题中扮演着重要角色,为了解决AQM的PID参数不能随时间调整,且不能适应动态和非线性网络的缺点,本文提出了一种新的PID控制器算法。新算法结合了PID控制和神经网络算法两者的优点,同时新的AQM算法在时延、吞吐量和稳定性方面均优于一般的PID控制器。

教育期刊网 http://www.jyqkw.com
关键词 神经网络;PID控制器;AQM

Optimised Design of Neural Network PID Controller Applied in AQM

ZHOU Xue-han

(Gui Lin University of Electronic Technology, Guilin Guangxi 541004, China)

【Abstract】active queue management (AQM) plays a significant role in network congestion. A new adaptive pid controller for AQM is presented to overcome the shortcomings of pid AQM, such as parameters cannot be adjusted with time, cannot be adapted to the dynamic and nonlinear network. The new algorithm combines the advantages of both PID controller and neural network algorithm,at the same time, the new AQM algorithm is superior to a typical pid controller on the time delay, throughput and queue stability.

【Key words】Neural network; PID controller; AQM

0引言

近年来人们对计算机网络的服务质量要求越来越高,路由器的主动队列管理(AQM)是一项减少端到端的时间延时和吞吐量的重要技术。随机早期检测算法(Random Early Detection, RED)是最早提出的符合主动队列管理思想的算法,它的基本思想是在缓冲区溢出或网络拥塞发生之前随机的丢弃数据包。对于不同的网络条件,RED算法的参数很难调整,同时RED算法的参数对不同网络负载非常敏感。

随着TCP协议和模拟计算机网络的发展,基于控制理论的AQM成为了一个研究热点。相比RED算法,在AQM中基于经典控制理论的P与PI控制器都有很好的队列稳定性,但它们的响应速度较慢。文献1基于增益和相位裕度提出了一种PID控制器,它比RED算法具有更好的队列稳定性,但PID控制器的参数很难调整,尤其是在不确定的时变网络环境中更难调整。为了解决AQM和ECN标记的问题,文献[2]提出了一种基于神经网络的自适应PID控制器,为了克服PID控制器在AQM中的不足,本文基于神经网络提出了一种改进的PID控制算法,新算法结构简单易于实现。

1TCP/AQM系统模型

2基于神经网络PID控制器的设计

文献[4]首先提出了基于神经网络的PID控制器,本文基于在线自学习和任意函数近似表示性能,利用PID控制器解决网络拥塞问题。在AQM中,我们根据网络的变化对损失概率进行调整,由于信息源能根据丢包程度不同随时间进行响应,因此我们采用一个简单的基于神经网络的PID控制器(SPIDNN)作为输出。SPIDNN是三层前馈神经网络,其结构设定为2 * 3 * 1。神经网络的输入层有两个神经元,可以接收两个输入信息。隐含层有三个神经元,它们分别是比例、积分、微分神经元,这些神经元可以实现比例、积分、微分操作。输出层只有一个神经元作为控制器的输出,图2是一个基于神经网络的PID控制器框图。

3两种提高SPIDNN学习率的方法

一种是附加动量法。在从输入层到输出层网络权值学习的过程中,我们不仅要考虑误差在梯度中所起的作用,同时还要考虑误差的影响趋势。为了避免在学习过程中的权值振荡,收敛速度慢和目标函数陷入局部极小值,我们可以用附加动量法。该方法从本质上考虑先前的权值在当前权值中所起的作用,因此它能确保权值调整方向的正确性,最终通过反响传播算法得到新的权值。权值调整的新规则如下:

在上式中K是训练次数,?琢为动量因子。

另一种是自适应学习速率法。在SPIDNN算法中?浊是学习速率,它的值影响SPIDNN的学习速度,如果学习率小,该算法的收敛性较好,但学习速度慢。如果学习率大,学习速度快,但该系统易于振荡。在学习速率固定的情况下,很难在收敛和学习速度间得到一个平衡。通常人们根据根据经验来选取学习率。对于一个固定的学习率,训练开始是更好的,但在后面的训练中可能就不适合了。为了解决这个问题,可以在训练过程中不断调节学习率。

自适应学习速率法的基本思想是:将当前误差与先前误差进行对比,如果误差反弹或上升,表明过调制,然后我们就减少学习率。如果误差一直在下降,表明学习率较小应该增大,当误差再次反弹时,我们再次减小学习速率,从而反复对收敛速度进行调整,这种方法也避免了自适应学习陷入局部极小。自适应学习率的计算公式如下:

4小结

本文提出一种新的应用于AQM的神经网络PID控制器算法,提出了两种学习率改进方法,本文算法结合了PID控制和神经网络算法两者的优点,同时在时延、吞吐量和稳定性方面均优于一般的PID控制器。

教育期刊网 http://www.jyqkw.com
参考文献

[1]Chu S Y, Teng C C. Tuning of PID controllers based on gain and phase margin specifications using fuzzy neural network[J]. Fuzzy sets and systems, 1999,101(1): 21-30.

[2]Zhou C, Zhang L, Chen Q. An adaptive PID controller for AQM with ECN marks based on neural networks[C]//Asian Control Conference, 2009. ASCC 2009. 7th. IEEE, 2009:779-783.

[3]Misra V, Gong W B, Towsley D. Fluid-based analysis of a network of AQM routers supporting TCP flows with an application to RED[C]//ACM SIGCOMM Computer Communication Review. ACM, 2000,30(4):151-160.

[4]Shu huailin. PID controller based on neural networks and its control system[M]. Nation Defense Industry Press. Beijing.2006.

[责任编辑:邓丽丽]