基于调度电话语音信息的调度命令智能生成方法

2021-04-29 11:27吴佳佳彭其渊鲁工圆

铁道运输与经济 2021年4期

关键词：权重

吴佳佳，彭其渊, ，鲁工圆,

（1.西南交通大学交通运输与物流学院，四川成都 611756；2.西南交通大学综合交通运输智能化国家地方联合工程实验室，四川成都 611756)

0 引言

行车调度命令是列车调度员在进行特定行车作业时发布的调度命令。列车调度员接收到调度命令发布请求后，在CTC/TDCS 的调度命令管理系统中选择调度命令模板，人工填写调度命令参数并发布。此类重复的调度命令拟写流程占用了调度员大量时间，在高强度的工作状态下，调度命令错字、漏字等内容不准确的情况也时有发生。通过研究基于调度电话语音信息的调度命令智能生成方法，能够实现调度电话向调度命令的直接转化，提高调度命令发布的效率与准确性。此外，实现调度命令的智能化生成也是我国高速铁路智能调度指挥系统建立的重要一环[1]。

目前关于调度命令的研究，大多集中于调度命令管理系统的设计、调度命令发布流程的规范化方面。在调度命令管理方面，阎帆等[2]针对目前跨信息系统以及同系统中各个调度工种的调度命令传递的兼容性差、可靠性低的问题，采用面向服务的架构SOA 进行了调度命令管理系统的开发，实现了调度命令的跨系统传递；武英强[3]设计了一套车辆段调度命令发布系统，解决了车辆段调度命令发布格式统一、命令发布可控、易于统计查询管理的关键问题；陈革新[4]运用数据库开发了一套客运调度命令发布与接收系统，改善了客运调度命令通过电话或手工记录的低效方式。在调度命令的规范化方面，吴朝辉[5]分析了发布、传达及执行行车调度命令过程中常见的问题，并针对问题提出了重点改进措施。关于调度命令智能生成方法的研究，目前尚处于起步状态，彭其渊等[6]运用预警文本-调度命令相对应的数据训练自然语言处理模型seq2seq，并提出了调度命令修正策略，共同构成了基于预警文本信息的调度命令智能生成模型，在调度命令决策的智能化方面迈出重要一步。综上所述，现有的研究多集中于调度命令管理系统，仅有的关于行车调度命令生成方法的研究则侧重于信息来源为预警文本情况下的调度命令生成，文中研究的调度命令智能生成方法基于列车调度员接收到的调度电话语音信息，是对调度命令智能生成方法系统的一个重要补充。

1 调度命令智能生成方法架构

1.1 调度命令内容及发布流程

一条完整的行车调度命令内容由模板及参数构成，调度命令模板是《铁路运输调度规则》中规定的调度命令统一格式，调度命令参数是命令指示的车站、车次、限速值等需要列车调度员填写的内容。

《铁路运输调度规则(高速铁路部分)》(铁总运[2017] 128 号)规定高速铁路常用行车调度命令模板按照不同的功能分为27 类，共53 条(D1 ～ D53)。这些调度命令模板从发布场景上又可以分为以下3 种情形。

（1）施工维修命令：向车站下达的指示施工维修开始、结束及是否开行路用列车的调度命令。

（2）应急处置命令：设备故障、恶劣天气、自然灾害等情况下发布的调度命令。

（3）其他命令：临时停运、加开列车、越出站界调车等。

根据某铁路局集团公司调度所高铁行调台发布的调度命令数量统计，该调度台2019 年6—7 月共计发布行车调度命令14 324 条，通过分析发布数量最多的调度命令数量及在所有发布命令中的占比，得到调度命令发布场景比例如表1 所示。

由表1 可知，施工维修及应急处置命令占比较高(84.54%)，其他命令占比较低(15.46%)。

应急处置情况又可分为设备故障情形及其他情形。在施工维修及设备故障应急处置情形下的调度命令下达，严格遵循“登、请、下令”的3 步原则。首先设备管理单位在施工维修电子管理系统或《行车设备检查登记簿》上进行登记；再由车站值班员或设备管理单位通过调度电话向列车调度员诵读登记的请求内容，请求发令，最后列车调度员依据请求内容编辑调度命令并下达。其他应急处置情形下(如接触网跳闸、天气恶劣难以辨认信号等)，相关单位(司机、设备管理单位等)通过调度电话向列车调度员通知具体情况，列车调度员与相关单位人员沟通确认车站、里程标等参数信息后编辑调度命令并下达。施工维修、应急处置场景下调度命令发布流程如图1 所示。

其他场景包括需要临时加开、停运列车、越出站界调车等情况，此类情况下的调度命令下达需要综合考虑列车运行图、实绩运行图、日班计划等多方面信息，调度命令决策信息来源广泛，因而暂不列入研究。

综上所述，在实际发布的行车调度命令中，施工维修与应急处置场景下发布的调度命令占很大比重，并且这些场景下的调度命令信息来源单一，均为调度电话语音内容。列车调度员根据调度电话选择合适的调度命令模板，编辑参数并下达。上述流程信息来源单一且高度重复、模式化，有必要研究一种调度命令的智能生成方法，从调度电话中智能匹配调度命令模板，抽取调度命令参数并填入模板，生成完整调度命令。

表1 调度命令发布场景比例Tab.1 Proportions of dispatching commands release scenario

1.2 调度命令智能生成方法架构

高速铁路列车调度命令智能生成方法由语音识别、文本匹配、参数抽取3 个模块构成：①调度电话语音识别。将调度员接收到的调度电话语音信息转化为文本信息。②调度命令匹配。根据调度电话文本匹配所需调度命令模板。③调度命令参数的抽取与填写。从调度电话文本中提取所需的调度命令参数信息，判断参数的完整性并依序填入调度命令模板。调度命令智能生成方法架构如图2 所示。

图1 施工维修、应急处置场景下调度命令发布流程Fig.1 Release process of construction and maintenance dispatching command and emergency handling dispatching command

2 基于调度电话语音信息的调度命令智能生成方法

2.1 调度电话语音识别

在中文语音识别领域，国内的语音识别研究团队已经开发了具有实用化水平的语音识别接口，如科大讯飞、百度语音、腾讯语音等。综合对比识别准确率、开发平台、专业化拓展支持3方面因素，研究选用科大讯飞的在线语音听写JavaSDK 进行语音信息的识别。为实现高速铁路调度方面的专业领域化语音识别，使用科大讯飞语音识别自定义字典的功能，上传了某铁路局集团公司辖内的车站及线路所名称字典(以下简称《站名字典》)以及铁路调度专业词汇字典，自定义词典词汇数目共946条，提升了语音识别模块的识别率。

2.2 调度命令模板匹配

调度命令模板匹配可通过文本相似度计算进行。文中选择了2 种常用的文本相似度计算方法，即编辑距离法和基于TF-IDF 算法的向量空间模型进行相似度计算，并通过实验对比2 种方法的实际效果。

图2 调度命令智能生成方法架构Fig.2 Framework of intelligent dispatching command generation method

2.2.1 调度命令场景－调度命令模板知识库

首先考虑采用上述2 种方法对调度电话文本与调度命令模板直接进行相似度计算，即直接匹配。但匹配结果表明，由于部分调度电话文本与调度命令模板文本之间的内容重合度较低，匹配准确率并不高。因此，研究构建了调度命令场景－调度命令模板相对应的知识库(以下简称“知识库”)，对每种场景下可能出现的调度电话内容及对应的调度命令模板进行了归类整理。考虑调度电话内容的多样性，知识库建立的主要依据为《铁路技术管理规程(高速铁路部分)》《高速铁路列车调度员应急处置指导书》、实际施工维修登销记请求内容、设备故障登销记请求内容、应急处置语音内容5 个方面，调度命令场景－调度命令模板知识库示例如表2 所示。

2.2.2 改进的编辑距离法

编辑距离法(Levenshetin Distance)是由Levenshetin[7]于1966 年提出的文本相似度计算方法，通过计算源字符串S与目标字符串T之间的编辑距离来度量二者的相似度。赵作鹏[8]对该方法进行了改进，增加了计算点前后非相邻字符间的交换操作，提升了编辑距离法在中文语境中的适用度。假设m为字符串S的长度，n为目标字符串T的长度，Dmn为2 个字符串之间的编辑距离，字符串S与字符串T之间的编辑距离D(S，T)的计算公式为

式中：si，tj分别表示字符串S中的第i个字符与字符串T中的第j个字符，0 ≤i≤m，0 ≤j≤n；Dij表示从s1…si到t1…tj的编辑距离。

编辑距离相似度SI定义为

表2 调度命令场景－调度命令模板知识库示例Tab.2 Examples of dispatching command situation-dispatching command template knowledge base

式中：Lmax为字符串S，T中较长的字符串长度；LD为两字符串的编辑距离值。可见编辑距离越大，字符串间的相似度越低。

2.2.3 基于TF-IDF 算法的向量空间模型

向量空间模型(Vector Space Model，VSM)是由Salton 等[9]于1969 年首次提出的文本表示方法，该方法将文本映射到向量空间中，通过含文本特征项(词)的向量表示文本，通过比较向量之间的夹角大小来衡量文本间的相似度。

本研究中，文本特征项的权重计算方法采用经典的TF-IDF 算法：每个文本特征项的权值表示为该词的词频以及逆文档频率的乘积。

式中：TFw,Di为关键词w的词频；count(w)为关键词w在文档Di中出现的次数，次；|Di|为文档Di中所有词的数量，个；IDFw为关键词w的逆文档频率；N为所有文档总数，个；I(w，Di)表示文档Di是否包含关键词w，若包含则为1，否则为0；TFIDFw,Di为关键词w的TF-IDF 权重。

将文本表示为向量后，计算两向量夹角的余弦值从而对比文本相似度，计算公式为

式中：a，b分别表示2 个n维向量；cosθ表示两向量的夹角余弦值；Ai，Bi分别表示2 个向量的第i个元素。

2.3 调度命令参数的抽取与填写

2.3.1 调度命令参数定义及抽取

根据统计，53 条高速铁路行车调度命令模板中，涉及的参数主要包括通知编号、车站、车次号、线路方向、时间、里程标、限速值、股道号、道岔号、车辆数、时间长度、机车/轨道车号共12 种，每条模板包含其中的几种参数。其中，车站参数可通过遍历《站名字典》进行识别，其他参数均具有固定的格式，可使用正则表达式从调度电话文本中抽取。除车站外的11 种参数对应的正则表达式如表3 所示。

表3 除车站外的11 种参数对应的正则表达式Tab.3 Regular expressions of 11 parameters excluding station

2.3.2 参数完整性判断与参数填写

由于每条调度命令模板要求的参数各不相同，依据各模板的参数要求，利用0-1 变量构建了12×53 (12 种参数类型、53 条调度命令模板)的调度命令模板参数需求矩阵，对于每一条调度命令模板，需要某种参数则对应矩阵元素值为1，否则为0。参数填写前，对每条调度电话文本的参数先进行完整性判断，参数需求为1 而实际提取的参数为空时进行参数缺失提示，从而提示调度员进行参数补充。

对匹配到的调度命令模板，将抽取的调度电话文本参数依照参数命名依次填入参数需求为1 的对

应位置中，即可生成完整的调度命令。

3 实验及结果

文中共设计了3 个实验以对比不同调度命令模板匹配模式以及匹配方法的匹配效果，并验证整个调度命令智能生成方法的有效性。实验数据来源：某铁路局集团公司调度所高铁行调台施工维修登销记请求内容、设备故障登销记请求内容文本共100条，此外，依据现场应急处置调度电话语音内容模拟了50 条文本数据，共计150 条调度电话文本及其对应的标准调度命令模板。

3.1 实验一

本实验对比调度命令模板匹配中直接匹配模式与基于知识库匹配模式的准确率，从而验证调度命令场景－调度命令模板知识库的必要性。

以基于知识库的匹配模式为例，2 种文本相似度计算方法下的匹配流程如下。

（1）改进的编辑距离法。①编辑距离计算。针对某一条调度电话文本D，依据公式⑴分别计算其与知识库中每条调度命令场景文本的编辑距离。②编辑距离相似度计算。根据公式⑵计算每对调度电话文本与调度命令场景文本的编辑距离相似度。③最大相似度获取。遍历知识库，获得与调度电话文本D编辑距离相似度最大的调度命令场景文本，记录其对应的调度命令模板编号。

（2）向量空间模型。①文本预处理。对于待匹配的调度电话文本D与知识库中的调度命令场景文本，使用jieba 分词工具进行分词操作，并去除在文本中没有实际含义的词，如“的、了、与”等停用词。②相似度计算。对分词后的词集合中的每个词，依据公式 ⑶—⑸ 计算其TFIDF权重值，得出两文本的向量表示，并依据公式 ⑹ 计算两向量的余弦相似度。

（3）最大相似度获取。遍历知识库，获得与调度电话文本D余弦相似度最大的调度命令场景文本，记录其对应的调度命令模板编号。

模板匹配的准确率P的计算公式为

式中：P表示模板匹配的准确率；R表示各匹配方法与匹配模式下，匹配所得的调度命令模板编号与标准调度命令模板编号完全一致的调度电话文本数量；N表示所有调度电话文本数据量(150 条)。

直接匹配与基于知识库匹配准确率对比实验结果如表4 所示。

由表4 可知，对于基于知识库匹配与直接匹配2 种匹配模式，使用改进的编辑距离法时，前者比后者的匹配准确率高22.13%；使用向量空间模型方法时，前者比后者高30.3%。2 种匹配方法下基于知识库的匹配准确率均显著高于直接匹配，可以证明知识库的建立能够大幅提升调度命令模板匹配的准确率。

表4 直接匹配与基于知识库匹配准确率对比实验结果Tab.4 Comparison of direct matching and knowledge base based matching accuracy

3.2 实验二

本实验对比2 种文本匹配方法的匹配准确率与匹配速度。在上述匹配准确率实验的基础上，采用准确率更高的基于知识库匹配模式，计算每次调度命令模板匹配耗时并统计单次匹配平均耗时，调度命令匹配方法对比实验结果如表5 所示。

由表5 可知，在匹配准确率方面，向量空间模型相较改进的编辑距离法高13.02%；在匹配耗时方面，由于向量空间模型中涉及分词操作，相较改进的编辑距离法单次匹配平均耗时长1 815 ms。考虑到在调度命令生成的应用场景下，准确率更具重要性；并且在实际生产过程中，每条调度命令人工编辑耗时约15 ～ 30 s，此处的单次匹配平均耗时差值仅为1.8 s，对调度命令智能生成流程影响较小。综上所述，优先考虑匹配准确率，研究选择向量空间模型作为调度命令模板匹配的核心方法。

3.3 实验三

本实验采用实验人员口述调度电话文本的形式，演示整个调度命令智能生成方法的实际效果，实验的输入为实验人员口述的调度电话，输出为调度命令内容。另外，实验统计了每条数据从口述结束到输出结果的耗时，调度命令智能生成实验结果示例如表6 所示。

由表6 可见，文中提出的方法能够依据语音形式的调度电话准确匹配到所需的调度命令模板，并从中提取参数填入模板相应的位置，生成调度命令。当调度电话本身参数信息不足时(如车次信息需要列车调度员根据列车运用计划填写)，调度命令空出相应的位置并给予调度员参数不足的提示。在耗时方面，平均耗时在调度电话口述结束后的2.5 s 内，具备较高的时效性，能够大幅提升调度员调度命令发布的效率。另一方面，由于本方法自动抽取参数，能够解决既往调度命令编辑过程中容易出现的错字、漏字等问题，调度命令内容更加准确。

表5 调度命令匹配方法对比实验结果Tab.5 Experimental results of comparison between dispatching command matching methods

表6 调度命令智能生成实验结果示例Tab.6 Examples of intelligently generating experiments results by dispatching command

4 结束语

高速铁路智能化是未来的发展方向，实现调度命令的智能生成也是高速铁路调度指挥系统智能化的一个重要环节。针对现行高速铁路行车调度命令发布流程中，调度命令拟写工作繁重、重复且模式化的问题，设计了基于调度电话语音信息的高速铁路调度命令智能生成方法。通过实验验证，该方法能够实现调度电话向调度命令的直接转化，在接听到需下达调度命令的调度电话后，调度员无需人工拟写调度命令，只需检查本方法自动生成的调度命令模板、参数内容是否完全准确即可，减轻了调度员的工作量，大幅提升了调度命令发布的效率。由于调度命令智能生成主要针对施工维修与应急处置命令，对于占比较小但信息来源复杂的其他命令的智能生成还有待进一步研究。