第1章 绪论
1.1 研究背景
我国高速铁路已进入大规模的网络化运营时代,具有速度高、密度大、行车量大等特点,其运输组织复杂性为世界高铁之*。
大数据和“互联网+” 已经融入社会各个领域,京张高铁的运营标志着我国高速铁路在行车、服务、运维等方面实现了智能升级。智能高铁将采用云计算、物联网、大数据、北斗定位、5G 移动通信、人工智能等先进技术,通过新一代信息技术与高速铁路技术的集成融合,全面感知、泛在互联、融合处理、主动学习和科学决策,实现高铁的智能建造、智能装备和智能运营已成为铁路工作者和研究者追逐的目标。
高速铁路智能运营涉及供电、调度指挥、运营监测、客运服务、防灾监测、故障诊断、应急处置等的智能化,目标是保障列车高效正常运行,为旅客提供安全、舒适、便捷的出行服务。高速铁路智能调度指挥系统是高铁智能运营的中枢系统,担负着组织指挥列车运行和日常生产活动的重要任务,是保证高速列车安全、正点、高效运行的现代控制与管理系统,涉及行车组织、通信信号、牵引供电、安全监控、综合维护等诸多专业,并兼备计划编制、计划调整、行车指挥、设备控制、设备检测、设备维护、环境检测等列车运行管理功能。其支撑技术包括计算机、网络通信、数据库、软件工程、系统控制、系统安全防护、智能决策等。智能调度理论是智能运营的核心基础理论,科学难题《列车晚点传播问题》和《轨道交通调度指挥智能化及风险预警》入选由教育部、科技部、中国科学院、国家自然科学基金委员会等联合发起的《10000个科学难题 交通运输科学卷》(2018年),“构建轨道交通调度指挥系统协同理论,揭示系统协同机理”、“建立和完善网络化列车运行调整、运营调度智能化理论”是轨道交通运输组织优化亟待解决的难题。
国内外已有的相关研究主要侧重宏观层面的列车运行调整建模及算法,建立在一定的列车干扰及晚点分布假设基础上,并不能完全反映高速列车实际晚点分布特征,已有的相关数学模型大多对问题进行过度抽象和一定程度简化,使相关研究成果仍处于实验室阶段,复杂数学计算过程及其模型应用于铁路调度实践仍有一定距离,且缺乏对列车晚点传播过程及微观机理的研究。列车运行图中预留的车站及区间冗余时间、线间冗余时间(以下统称冗余时间)是调度员可以用来恢复晚点的资源,冗余时间布局方案直接影响晚点恢复的效率,并关系到晚点影响的总时间、晚点影响的范围。但目前的冗余时间布局主要依靠对历史布局方案的简单统计,缺乏对其晚点恢复能力的考虑。根据线路、车站具体运营情况确定冗余时间的运用效率并据此优化冗余时间的布局方案,将有利于提高高速铁路运行图的鲁棒性,增强晚点恢复能力。
我国铁路信息化建设也已取得了飞速的发展,规模越来越大的精准运营数据已获取并得以运用。列车运行实绩(实际运行图、晚点原因记录表、设备运用状态等)得以有效记录并保存,包含了列车运行状态、正晚点信息、列车间关系、设备利用状态等诸多重要信息,是铁路运输生产绩效的重要体现。如果能够基于列车运行实绩提取列车运行规律并建立列车运行过程模型,将极大地有利于调度员预测未来列车运行趋势,预判和估计高速列车晚点的可能发展态势、相关调度决策的预期效果、列车晚点可能恢复的程度等,从而制定更为精准的运行调整计划并实施预测调度。得益于大数据技术、人工智能理论的发展,数据驱动方法已经在诸多领域的理论研究和运营实践中凸显了其优势。数据科学为高速列车行车指挥优化问题提供了新的解决渠道,基于高速列车的运行实绩、运用数据驱动方法研究高速列车晚点传播及恢复问题已成为必然趋势,知识自动化必将为高速列车行车指挥决策提供有效支撑。
综上,解析高速列车晚点传播机理,提高晚点恢复能力及列车运行可靠性已成为我国高速铁路运输组织亟待解决的问题。基于高速列车运行实绩,宏观规律与微观机理研究相结合,运用数据驱动方法建立晚点传播模型,揭示列车晚点的横向和纵向传播机理,提出晚点恢复能力*大化的冗余时间布局方法以提高运行图鲁棒性是高速铁路行车指挥需要解决的关键科学问题,是高速铁路实现调度指挥智能化的必要工作。
1.2 研究动态分析
要研究列车的晚点传播过程,晚点分布及其影响是首先需要解决的问题。而要建立晚点传播和吸收的模型,列车的行程时间估计、晚点传播、晚点吸收过程等是需要重点研究的问题。要提高运行图的鲁棒性,冗余时间布局理论和方法是国内外研究者重点关注的问题。因此,以下将首先概要分析基于传统数学模型驱动方法的相关研究情况,然后将重点分析运用数据驱动方法研究列车晚点分布、晚点传播理论、冗余时间布局三个问题的国内外动态。
1.2.1 基于传统数学模型驱动的相关研究动态概况
传统数学模型驱动方法是国内外学者研究晚点传播过程建模及冗余时间布局问题广泛使用的方法,主要包括排队论、*优调度算法、网络规划等运筹学方法。事件图[1]、活动图[2]、分布模型[3]等被用来计算列车的连带晚点时间、研究列车晚点传播过程;Carey 等[4]采用随机逼近的方法推导出了行车间隔和连带晚点之间的近似关系[5],并进而开发了晚点传播仿真实验系统预测车站连带晚点的概率分布。国内对于晚点传播理论的研究始于20世纪90年代,胡思继和孙全欣[6]通过将在区段内运行的列车分为不同层次,然后基于概率论及随机过程理论,研究了区段内各类运行列车组间列车晚点传播过程及其传播规律,并推导出了相应的理论计算公式,这为我国随后的列车晚点传播研究指明了方向;杨肇夏等[7,8]通过研发列车晚点传播模拟系统来完成对列车运行线的动态性能测试以及列车运行图的动态性能指标计算;周华亮等基于 NaSch 模型提出了用于模拟准移动闭塞系统的元胞自动机模型,模拟了准移动闭塞系统列车延迟传播[9,10];王昕等[11]运用极大代数(Max-Plus Algebra)方法建立了列车运行图的状态动力学方程和列车晚点传播模型。传染模型、极大代数、复杂网络等理论和方法也被应用于晚点传播机理的研究;殷勇等[12]运用复杂网络的传播动力学理论分析了路网中列车晚点传播扩散情况,建立了铁路列车晚点传播的 SIR 模型,并对车站晚点后的晚点传播情况进行了模拟;刘宇等[13]通过分析晚点传播的基础特性,建立了基于极大代数的离散事件动态系统晚点传播模型,并以长三角城际铁路网为例对晚点传播进行了描述和推演;袁志明[14]指出了晚点传播的主因是初始晚点列车导致的连带晚点情况,并在路网中产生了多米诺效应式的连锁晚点现象,通过构造基于随机森林的列车到站晚点预测模型,提升了列车晚点预测的精度和准确度。但以上的研究大多数都是基于数学模型、经验知识等进行的,结合列车运行实绩数据来对晚点传播的研究相对较少。文超等[15]在研究高速铁路列车运行冲突机理时,构建了列车运行偏离计划的状态转移图。
常常通过延长列车区间运行时间和增加停站时间来设置冗余时间,并进而恢复列车晚点[16],但是冗余时间的增加将导致通过能力的浪费[17];国外列车晚点恢复模型及算法的相关综述显示[18,19]:随机分析模型、整数规划模型、决策树方法、深度优先的贪婪算法等均被用来研究晚点恢复及冗余时间布局的问题[20];计算机仿真方法被认为是建立连带晚点恢复模型的有效方法[21,22]。彭其渊[23]分析了列车运行图缓冲时间的大小及其分布规律对列车晚点传播影响;刘敏和韩宝明[24]提出了基于晚点恢复容量限制的列车运行图可恢复鲁棒性优化模型。
传统数学模型驱动的研究方法需要建立在对晚点致因及分布、传播机理、恢复过程等具有足够的认识和精确描述的基础上,而实际上大部分研究是基于一定的假设和前提条件进行的,要么对问题简化,要么提前设定晚点分布规律或传播模式,因此,所建立的模型和算法对使用范围要求比较严苛,而对实际运输生产的指导性不足,相关模型、算法以及据此开发的系统基本都还处于实验室阶段。
1.2.2 基于数据驱动的相关研究动态概况
得益于铁路信息化及近年来大数据技术的发展[25],基于铁路运行实绩开展调度指挥建模的研究已逐步展开[26]。OpenTrack 和 RailSys 等商业仿真实验软件也被开发和广泛应用[27,28]。代明睿等[29]提出了我国铁路应用大数据的可能应用领域及关键技术。各个国家均对运用铁路运营数据开展相关研究给予了高度关注,表1-1所列为运用数据驱动方法开展列车晚点传播及恢复相关研究的典型国家。
表1-1 运用数据驱动方法开展列车晚点传播及恢复相关研究的典型国家
国内外对于列车晚点传播及恢复的研究主要集中在列车运行晚点分布、晚点预测、晚点恢复和冗余时间布局优化等方面,所运用的数据驱动方法主要包括统计模型、智能计算和机器学习等,如图1-1所示。
图1-1 晚点传播及恢复主要涉及问题及所使用的数据驱动方法
1.2.2.1 列车运行晚点分布研究现状分析
(1)晚点致因分析
1)晚点致因分析的统计模型
列车晚点致因分析为铁路运营设计和管理提供了依据,许多研究都聚焦运用统计学方法研究列车的晚点致因。
晚点的影响因素通常是从历史数据统计中得到的。通过分析2001~2003年挪威铁路列车运行记录得到:乘客数量、满座率、基础设施利用率、列车取消、临时限速、始发正点率以及列车优先等级是影响列车运行的主要因素[39]。Palmqvist等[40]基于2015年瑞典所有列车的3240万个列车运行详细时刻表记录、超过8万个基础设施的综合运输数据以及近8700万条天气观测数据,运用统计方法量化研究了恶劣天气、计划运行图、基础设施运用等相关指标对旅客列车正点率的影响程度。从外部因素来看,恶劣的天气情况一直是造成初始晚点的重要原因。文献[34]对极端天气的影响进行了新的探索,该研究使用了来自英国铁路网所处的天气时空数据,并以2012年6月28日的强风暴为案例进行研究。文献[41]以都柏林地区快速轨道交通系统的观测数据为基础,使用了每小时所观测的超过6000次列车的离站数据,对天气条件对大都市通勤铁路运行影响做了统计学分析。2005年挪威铁路的正点率统计数据显示,超过4000小时的晚点是由基础设施状况造成的,约占总晚点时间的30%[42]。
文献[43]运用统计学方法研究了美国铁路货运系统内部拥堵的相关因素,包括:会车、通过、越行、列车间隔变化以及列车出发间隔大小等,该研究发现会车、通过、越行等行车策略是晚点产生的主要因素。文献[44]基于英国的列车晚点数据建立了列车晚点与通过能力利用率间的显著正相关关系,研究表明:较高的能力利用率是造成列车晚点*重要的内部因素之一。从中国高铁的运行数据中,我们可以得到能力利用率和晚点之间也存在类似的关系图,统计数据还显示,近90%的运行中断是由恶劣天气造成的[45]。这些研究结果可以帮助调度人员更好地了解高铁晚点的整体原因。近来,文献[38]基于中国武汉—广州高铁2015年2月24日至2015年11月30日间超过1200次的列车运行记录,确定了导致高速列车初始晚点的七类外部致因。
基于列车运行记录的数据驱动可视化可以帮助我们找出列车晚点的原因。通过对列车运行历史数据的可视化,运行图的编制人员可以直观地了解列车运行情况,并对晚点原因、晚点影响进行分析[35]。色度图(Chromatic Diagram)可以对原始数据进行抽象和绘图找出晚点的原因[46,47]。气泡图(the Bubble Diagram)、渐增晚点图(Incremental Delay Diagram)、三维图(3D Diagram)以及其他的信息可视化方法,如列车晚点时间、停站时间、区间运行时间和间隔时间的箱图以及晚点的散点图都可以用于列车历史运行记录的可视化[35]。借助这些方法可以分析晚点的原因和晚点造成的影响,并通过比较结果来评价减少晚点的措施。目前,这些方法在铁路公司中深受青睐并得到了广泛的应用。
2)晚点致因分析的智能计算模型
展开