第一章绪论
1.1多智能体系统一致性问题概述
1988年,美国人工智能专家Minsky教授首次提出智能体(agent)概念,用来描述一个存在于特定环境,并能感知和改变环境的实体[1].这里,实体的含义是广泛的,它可以是一个机器人、车辆、飞行器,甚至可以是一个生物组织.粗略地讲,一组具有一定自主性的智能体以信息通信等方式互相耦合便形成了多智能体系统(multi-agent system).由于智能体外延的广泛性和智能体之间耦合方式的多样性,很难给出一个关于多智能体系统的严格数学定义,然而这并未减弱人们对多智能体系统的研究热情.
自然界中大量的复杂系统可以用形形色色的多智能体系统模型加以描述和刻画,典型的例子包括鸟群、鱼群、蜂群和细菌群落等.此外,随着计算、通信、小型化和嵌入式技术的发展,大规模实际工程系统的各个组成单元逐渐成为具有一定计算、执行和通信能力的智能体,为建立对应的多智能体系统模型提供了可能.基于此,多智能体系统的建模与控制问题受到来自数学、力学、控制、生物和计算机等领域学者的广泛关注.实证研究表明,通过局部的相互协调,个体层次上相对简单的自主运动能够形成整体层次上相当复杂的集群行为(collective behavior)[2].生物群落中,集群行为的形成能够使每个个体获得一定的利益,如觅食生存、集体筑巢和防御天敌等,通常仅靠单个个体的努力无法获得这些利益.上述分析表明深入研究自然界中生物群落集群优势的形成机制,必将为实际工程控制提供新的思想和方法.显然,利用集群优势的思想为实际工程控制服务的前提是如何设计一系列有效的控制算法使得多智能体系统涌现出一定的协调行为.在这一背景下,多智能体系统的协调控制问题逐渐成为系统与控制领域的一个研究热点,一大批具有深刻理论意义和实际工程背景的研究成果如雨后春笋般涌现[3,4].
与传统的单系统控制相比,多智能体系统协调控制有如下新特点:
(1)控制对象是多个而非单个.多智能体系统是由多个相对独立的智能体以信息通信等方式互相耦合而成的.特别地,某些大规模多智能体系统由成千上万个智能体组成,比如万维网(WWW)、因特网(Internet)等.
(2)控制手段是分布式的而非集中式的.由于多智能体系统大多具有较大的规模,工程上不可能也完全没必要设计一个控制器来集中控制所有的智能体.在智能体具有一定通信能力和执行能力的假设下,人们可以通过对单个智能体设计分布式的控制器来实现整体层次上的控制目标,该控制器设计只依赖于智能体本身与其邻居的相对状态(或输出)信息.
(3)控制目标是协调智能体之间的行为,以实现期望的运动构形和整体的运动方式,而非稳定性、有界性等指标.
在多智能体系统协调控制的研究中,众多分布式协调控制问题都可统一到一致性理论框架下来研究,故一致性控制是一个*为基础性的问题.所谓分布式一致性,即寻找恰当的分布式控制律使得所有智能体仅在与局部邻居交互相对状态或输出信息的情况下,将感兴趣的状态变量达成一致.例如,卫星编队需姿态一致,飞行器编队需速度一致,传感器网络需对目标状态信息保持一致等.
1.1.1多智能体系统一致性问题概念
首先根据上述关于分布式一致性的基本介绍,本小节给出多智能体系统分布式一致性控制问题的基本概念.
定义1.1(分布式一致性)对于具有某种动力学行为的多智能体系统,若每个智能体仅与其邻居进行局部信息交互,而使得整个多智能体系统的部分(或全部)状态变量趋于相同,则称该多智能体系统实现了部分(或全部)状态一致性.
由上所述可知,分布式一致性问题主要依赖于一致性协议的设计[5],而关于一致性问题的研究*早起源于20世纪70年代[6].概率统计学家DeGroot*先提出一个离散时间耦合线性系统模型,该模型可以看作多智能体系统模型的雏形,DeGroot利用加权平均的方法成功地估计出耦合系统中人们感兴趣的某些未知参数的概率分布函数[6].20世纪80年代,计算机技术得到长足发展,人们日常生活中的各个方面也逐渐出现了计算机的身影.同时,有限的硬件资源与人们日益增长的计算需求形成了一对尖锐的矛盾.为了有效地实施分布式计算进而合理地利用有限的硬件资源,Borkar[7]和Tsitsiklis[8]等研究了与分布式计算密切相关的异步一致性问题,并将理论结果成功地应用到分布式智能决策中.
1995年,Vicsek等提出了一个用来模拟平面上一组粒子自组织运动的离散时间多智能体模型[9].在Vicsek模型中,每个智能体以相同的速率v在平面上运动,第i个智能体t时刻的位置,的更新方式为
(1.1)
式中,第i个智能体t时刻的速度方向的更新方式为
(1.2)
Ni(t)表示t时刻第i个智能体的邻居集合,即由智能体i当前位置为圆心,半径为r>0的邻域内的所有个体组成;为上服从均匀分布的随机噪声.
由式(1.2)可知,在智能体运动过程中,位置与角度相互耦合在一起形成了比较复杂的非线性关系,这给Vicsek模型的理论分析带来困难.数值仿真表明:当智能体在平面上的分布密度较大且噪声强度较小时,所有智能体的运动方向*终保持一致.
2003年,Jadbabaie等研究了线性化无噪声Vicsek模型.模型中,第i个智能体t时刻速度方向θi(t)的更新方式为
(1.3)
式中,|Ni(t)|表示t时刻智能体i的邻居个数.利用代数图论和矩阵理论中的分析方法,证明了如果存在一列一致有界的时间区间使得在每一个时间区间内智能体间的通信图是联合连通的,则所有智能体的运动方向将渐近趋于一致[10].进一步地,Jadbabaie等给出了连续时间多智能体系统中智能体运动方向实现一致性的条件.Liu和Guo研究了没有噪声影响的原始Vicsek模型中的角度一致性问题,利用概率论的方法给出了只依赖于多智能体系统初始状态和模型参数的一致性实现的充分条件[11].
2004年,Olfati-Saber和Murray给出了研究连续时间一阶多智能体系统一致性问题的一般性框架[12].模型中,N个智能体的动力学行为由下式描述:
(1.4)
式中,xi(t)∈R是智能体i在t时刻的状态;ui(t)∈R是智能体i的控制输入.
智能体遵循如下一致性协议:
(1.5)
式中,[aij(t)]N×N为系统在t时刻通信图的邻接矩阵.此外,如果存在通信时延,则一致性协议具有如下形式:
(1.6)
式中,τij表示智能体i和智能体j之间的通信延迟.在文献[12]中,Olfati-Saber和Murray深入研究了如下三类一致性问题:通信图为定常强连通平衡图时的一致性问题,切换通信图下每一个可能的通信图为强连通平衡图时的一致性问题,以及具有定常单一通信时滞和定常无向连通通信图的一致性问题.
2005年,Ren和Beard研究了具有有向切换通信图的一阶连续和离散多智能体系统的一致性问题,给出系统实现一致性的充分必要条件,即如果存在一列一致有界的时间区间使得在每一个时间区间内智能体间的通信图联合地含有生成树,则所有智能体的运动方向将渐近趋于一致[13].一个显然的推论是,固定通信图条件下多智能体系统实现一致性的充分必要条件是通信图含有一棵生成树.
2005年,Moreau考虑了一阶离散非线性多智能体系统的一致性问题[14],智能体模型为
(1.7)
式中,是满足严格凸假设条件的集合.利用集值Lyapunov(李雅普诺夫)理论,Moreau给出了多智能体系统(1.7)在有向通信图条件下实现一致性的条件.
2007年,Lin等研究了一阶连续非线性多智能体系统的一致性问题[15],智能体模型为
(1.8)
这里记作严格次正切条件,可以看作连续时间下与式(1.7)中,相对应的条件.利用非光滑分析方法,Lin等给出了系统(1.8)实现一致性的充分必要条件[15].
Ren和Atkins考虑到一大类实际力学系统的运动需要同时用位置和速度来完全刻画,研究了二阶多智能体系统的一致性控制问题[16],智能体模型为
(1.9)
式中,分别表示智能体i的位置和速度;和为大于零的常数;矩阵代表多智能体系统通信图的邻接矩阵,如果智能体能够获得智能体j的信息,则有;否则.利用矩阵分析的方法,Ren和Atkins给出了有向固定通信图下多智能体系统(1.9)实现一致性的充分条件.研究表明,对于二阶多智能体系统,通信图联合含有生成树只是实现一致性的必要条件.2009年,Zhu等给出了有向固定通信图下二阶积分器多智能体系统实现一致性的充分必要条件[17].利用特征值分析和分岔理论分析方法,Yu等给出了具有定常单一通信时滞和有向通信图下二阶多智能体系统实现一致性的充分必要条件[18].利用切换系统分析方法,Hong等研究了一类具有无向切换通信图的二阶积分器多智能体系统的一致性控制问题,给出了通信图联合连通下系统实现一致性的充分条件[19].进一步地,Ren等研究了有向固定通信图下高阶积分器多智能体系统的一致性问题[20].Jiang和Wang研究了具有通信时滞和无向切换通信图的高阶多智能体系统的一致性问题[21].*后,Yu等给出了有向固定通信图下高阶多智能体系统实现一致性的充分必要条件[22].
在关于高阶积分器多智能体系统一致性问题研究的基础上,研究人员逐渐开始关注具有一般线性动力学行为的多智能体系统的一致性问题[23~26].模型中,每个智能体具有如下的动力学行为:
(1.10)
式中,分别代表智能体i的状态、输入和输出;和C为具有相容维数的定常实矩阵.易知,任意阶次的积分器多智能体系统模型均是线性多智能体系统模型(1.10)的特例和考虑了离散和连续时间线性多智能体系统的可一致性问题(consensusablity)[23].Li等将传统的基于观测器的控制方法推广到多智能体系统中,并提出了一致性区域的概念[24].基于一致性区域分析方法,Li等进一步研究了有向通信图下具有指定指数收敛速度的线性多智能体系统的一致性问题[25].Zhang等利用*优控制设计方法给出了几类新的基于邻居智能体间相对测量输出的观测器类型一致性协议[26].
1.1.2多智能体系统一致性控制问题研究现状
1.1.1节回顾了多智能体系统一致性控制问题的研究概念.本节重点从多智能体系统的个体动力学行为、通信模式、控制协议以及安全性4个方面对现有研究进行总结.
(1)具有固有动力学行为的多智能体系统一致性控制问题研究根据1.1.1节可知,在积分器多智能体系统中,智能体的动力学行为完全由耦合项决定.例如,在一阶积分器模型中,如果智能体i没有任何邻居,那么它只能保持静止状态;对于二阶积分器模型,没有任何邻居的智能体的加速度始终为零.事实上,几乎所有的力学系统均含有固有动力学行为,也就是说,一个没有任何邻居的智能体仍然能够按照自己固有的动力学行为进行演化,且其动力学行为与所处的外部环境的变化相关.此时,其动力学演化的方式可以十分复杂,但并不一定是保持静止或者做匀速运动.近年来,具有固有动力学行为的一般多智能体系统的一致性控制问题逐渐引起了学者们的关注.2008年,Ren研究了一类具有固有线性二阶动力学的简谐振子耦合网络的一致性问题,利用特征值分析的方法给出了固定通信图和切换通信图下闭环多智能体系统实现一致性的充分条件[27].Yu等研究了具有二阶非线性动力学行为的多智能体系统的一致性问题,给出了系统在有向通信图下实现一致性的充分条件[28].Liu和Jia研究了具有高阶未知非线性动力学行为的多智能体系统的一致性控制问题[29].另外,Chung和Slotine考虑了由
展开