环境试验设备系统的辨识器是改进了的Elman 神经网络,它用来动态的辨识被控对象的正向模型,为控制器提供误差及其梯度信息。由于Elman 神经网络属于局部反馈网络,其本质是动态的神经网络,所以可以随被控对象模型的变化而变化,最终收敛到稳定点,而不是被控对象模型静态关系的描述。
通过对被控对象动态辨识,我们可以根据辨识的结果构造一步预测控制器,使得系统得到更好的动态品质。系统的控制器是一个增强型的模糊神经网络。因此,系统的本质仍然是模糊控制。不过,运用神经网络来表达模糊推理从而构成的模糊神经网络具有单纯模糊控制不可比拟的优势。因为,模糊神经网络所表达的模糊推理蕴涵在神经网络权值中,网络通过自学习不断调整权值的同时也就达到了优化模糊规则和专家控制经的目的,最终得到全局收敛控制信号,实现全局较优控制。从系统辨识角度上看,由于有了神经网络对未知结构的非线性系统参数进行辨识,放松了以往传统辨识方法中要求系统线性、定常、结构已知的限制条件。
从控制角度上看,采用神经网络在线实时辨识与另一个神经网络控制器共同作用的方式,构成一种间接神经网络控制结构这种结构相当于一种内模控制。从理论上说,如果存在一个收敛的神经网络辨识权值WI 和神经网络控制器权值WC,能够保证系统均方差收敛或L2 收敛,那么当辨识网络收敛到WI,控制器网络收敛到WC 时,系统控制收敛。
但在实际工程中,这仅仅是控制系统收敛的一个充分条件而非必要条件。实际情况是,当系统控制收敛时,辨识网络和控制网络权值收敛,但并非惟一。因为收敛结果与网络初始权值的选择,控制信号的形式息息相关。这一点与传统辨识意义上的参数惟一收敛不同。我们知道,控制的目的是保证系统输出收敛,而非辨识网络和控制网络权值收敛。只是后者能够保证控制系统收敛到一个较好的程度,且可能具有较强的泛化能力。
此外,实际控制系统输出收敛的要求也好似因控制对象而异,只要满足一定条件即可,一味追求零误差既不现实也没有必要。在工程上,神经网络在线辨识由于受到采样时间的限制,辨识网络很难在一个采样周期内产生收敛。通常解决办法是选择合适的网络和学习算法,保证系统辨识沿时间轴收敛,即在每个采样周期内,给定循环训练次数,使网络逐步向收敛状态逼近。虽然此时根据可能还未收敛的辨识网络求得的控制量不能保证系统“立即”达到期望轨迹,但理论上只要辨识最终收敛,控制也会最终收敛。
http://www.dgzhenghang.cn