任务型人机对话系统中的认知技术概述

2021-05-11 06:46孙伟博张斌
中国新通信 2021年4期
关键词:人机交互

孙伟博 张斌

【摘要】    人与计算机的交互系统是将机器视为认知对象的人与计算机的交互系统。电脑软件、硬件技术和移动互联网的高速发展,人类和机器之间的认知对话系统能够有效地处理不准确的信息互动,并符合人类互动的自然习惯,得到了越来越多的关注。本文提出将人与机器之间的认知对话分为三个层次:物理层、管理层和应用层。相关技术包括通道技术、认知技术和知识管理技术。在其中,认知技术是一种新的交互式中间软件技术,是由于移动实时交互的新需求而产生的。它的目标是提供人类认知交互的特征,这些认知互动可以与另一方进行深刻的理解、学习、诱导和适应,其中大部分包括信息不准确的理解技术、基于不确定性的推理技术、适应和进化技术,这篇文章详细介绍了人类机器对话系统中认知技术的定置和具体概念,总结了相关技术领域的进展,并考虑了未来的关键研究方向。

【关键词】    人机交互    认知技术范畴    对话系统    认知控制

引言

人与计算机相互交互(HCI,人机交互)是一种技术,研究自计算机出现以来人类和计算机设备之间的相互作用。它的目标是让机器帮助人们高效、舒适和安全地完成任务。人类和计算机之间的互动是一种基本技术,它对信息时代的生产和生活产生了巨大的影响。美国在2000年实施的信息技术研究预算中,包括了“人机互动”、“软件”、“网络”和“人工计算”在内的四项核心研究[1]。Dialogue(对话)系统是人机交互技术的主要领域之一。, 这是一种计算机软件和硬件系统,人类和机器之间的相互信息交换可以满足人类的一些特殊和内在需求。大致来说, 交互系统包括图形用户界面(GUI)、虚拟现实交互等,所有人机交互系统。从狭义上讲,对话系统尤其适用于执行类似人类的通信任务的计算机系统。它的目的是使人与机器之间的对话像人与人之间的对话一样有效、快速和自然。这种交互式系统强调机器在执行任务、信息共享和环境感知方面的拟人化特征,并将其视为双边信息互动中的“认知对象”, 因此,“认知能力和相关技术”是这些系统的核心功能和特性。这篇文章讨论了人类机器狭小对话系统中的认知技术。

一、基于任务型人机对话系统中的认知技术

从本体结构和业务逻辑的角度来看,对话系统可以分为领域任务类型和开放类型的信息互动。领域任务型系统针对特定领域的应用程序,明确定义业务语义单位、本体结构和目标用户范畴,如查询航班、视频搜索、设备管理等。此类交互通常以特定的业务任务的执行为基础。公开信息的交互不是针对某个领域或一个非常大的领域。交互目的不是商业目标,而是满足用户在其他方面的需求,例如,开放的问答解惑、聊天等,即便在某种程度上可以发挥人工智能的作用,但是因为它不致力于帮助人们解决真正的现实问题,它的实际范围相对较小[2]。近年来移动终端的飞速发展使得人们越来越关注人和机器之间自然对话系统以及由此在学术和商业领域所产生的认知控制理论。这就是文章的重点。

1.1任务型对话系统认知技术范畴

现代的人机交互系统需要“控制层”,它将信道编码和服务器部分的知识连接起来,起到管理和协调前端和后台的作用。“控制层”的主要功能包括:从输入代码理解用户的初衷,管理并控制对话框(对话框管理),并将初衷转换为输出代码(信息生成)。是在传统的人体与电脑的机械系统中,可以忽略控制层,因为用户的意图是由输入工具精确定义的[4]。例如,当与图形用户界面交互时,点击鼠标打开或关闭窗口,内部的知识管理会直接导入。但是,在自然的人与机器的对话系统中,因为机器需要能够与人有效对话的认知主体,所以控制层是一个独立的不可缺少的模块,与此模块相关的技术:“认知技术”[5]。认知技术的类别主要包括以下类别:

(1)非精确条件下的理解

不确定性(或不精确)是人机对话渠道的重要特征之一。语音识别本身有不可避免的错误,因为噪音干扰,对话人的口音说话速度等等。当出现多通道时,每一条通道都会受到干扰和不确定。在IO层中的编码错误被传送到语义分析级别,导致语义分析的不确定性[3]。另一方面,从认知的角度来看,人们用模糊的信息进行沟通很容易,因为这分发信息的速度大大增加了。信息传输和对话意图不确定性,机器理解用户的意图已成为重要的认知技术类别之一[6]。与传统的“语义理解”和“自然语言处理”不同的根本区别在于,不确定性属于了研究领域。

(2)基于不确定性的推理及决策控制

人机对话系统的重要功能是有效的多回合互动。根据系统的运行状态并执行特定的任务,如果理解用户的意图,特别是不确定的意图理解、推理、决策反馈方法和反馈信息的情况下, 选择反馈方法和反馈内容最有助于完成任务,这是认知技术另一个重要方面。交互战略的核心是人机对话的闭环控制技术,由此赋予机器“推论和决策”的认知主观特性。

(3)交互自适应及进化

学习和适应能力是认知对象的另一个重要特征。机器适应用户输入和输出通道和控制层的适用技术是认知技术的第三类。在对话过程中,它不仅包括对用户输入和输出特性的低级别适应,还包括对用户行为的适应和互动的规律习惯的适应[4]。另一方面,认知控制技术除短期调整外还包括长期“进化”系统、用于研究新知识(语义元素等)和长期人类交互模式

1.2任務型对话系统的认知自然度

“自然交互”是任务型对话系统的目标,也是认知技术合理使用的结果。除了前述的自然语义交互方面的内容之外,任务型对话系统对其它方面的自然度要求也成为新的挑战。情绪的检测和传达是人类自然交互中不可或缺的一环。情感计算已经发展多年,在情感分类和特征建模、情感识别、情感表达等方面都有了较大进展,将情感分析应用于任务型对话系统也得到了产业界的重视,呼叫中心中利用情感分析来获取用户满意度也得到了应用。未来研究中,如何将情绪等非语义的自然交互信息全面引入任务型对话系统,是一个重要方向。这其中需要具体解决的重要问题包括:面向交互任务的情感、情境的量化分析感知及信息融合;情感的表达模型和高表现力的情感合成(主要是语音和图像);引人情感因素的对话状态空间定义及强化学习算法等。情感计算中的情感维度空间模型等提供了将情感特征量化的良好手段,将利于将情感信息引入POMDP框架。而在多模态交互条件下,结合文本、视频、音频进行联合的情感分析将是未来实现情感计算与任务型对话系统结合的重要方法。目前在国内外所有任务型对话系统研究中,都有一个最基本的假设:人机交互的一个轮回必须是一个“句子”。但这种一问一答的方式与实际人类自由对话的方式相去甚远。很多心理学文献都明确指出人类的交互是渐进性的。而且以整旬为处理单位会使整个人机对话的时间变长,变得不自然,也会影响用户,使他们对目标的注意力下降。更重要的是,以前的研究全部把轮回检测看成与对话管理无关的独立任务,并没有尝试去研究轮回检测对整体任务型对话系统的性能影响。尤其在较大尺度和真实环境的任务型对话系统中,往往不是由于机器听不懂用户或者不知道如何反馈导致了对话失败,而失败往往来源于机器不知道何时对用户反馈或者用户不知道什么时候该对机器说话[5]。

这个现象意味着目前的任务型对话系统研究只关注“反馈什么”,却缺失了另一个重要的交互研究课题:“何时反馈”,因此,基于自然轮回的任务型对话系统是认知技术未来研究的另一个重要课题。对此,一种可行的思路应是在对话管理器之外,引入新的“轮回管理器”,独立地对轮回和时序问题进行研究。

1.3大规模真实世界任务型对话系统

虽然任务型对话系统已经在若干真实世界系统中得到过实现,但其系统都还是小规模或非真实的系统.例如卡内基梅隆大学的Spoken Dialogue Challenge中的公交信息查询系统虽然是在匹兹堡市运行的真实系统,但其处理的任务仅仅是公交车的站点和时间信息,任务规模很小;而欧盟CLASSIC项目中的餐馆查询系统虽然涉及的数据信息较多任务规模较大,但相关系统的运行还是基于招募的测试者而非真实的用户,这也使得对话策略的训练和任务型对话系统的评估都受到了影响.认知技术至今仍然还没有在大数据真实条件下得到完整的实践验证[6]。因此,在已有研究的基础上,面向真实世界的大规模任务搭建并运行完整的任务型对话系统,并与传统的机械式任务型对话系统对比是认知技术的实验方向,也是应对前述各种挑战的必要的实测平台。

二、总结

任务型人机任务型对话系统是人机对话领域的热门研究课题之一,鉴于任务型人机任务型对话系统在不同领域都存在着广泛的应用价值,为了有效降低任务型人机任务型对话系统的开发周期和研发成本,提升任务型人机任务型对话系统开发的便利性,本文目标是认识了解任务型对话系统中的认知技术。

参  考  文  献

[1]黄寅.任务型人机对话系统开发平台研究[J].信息与电脑(理论版),2020,32(06):115-117.

[2]赵阳洋,王振宇,王佩,杨添,张睿,尹凯.任务型对话系统研究综述[J].计算机学报,2020,43(10):1862-1896.

[3]齐玉碧. 任务型人机对话系统开发平台的设计与实现[D].北京邮电大学,2019.

[4]陈健鹏,马建辉,王怡君.基于多轮交互的人机对话系统综述[J].南京信息工程大学学报(自然科学版),2019,11(03):256-268.

[5]孟張圆. 任务型人机对话系统的研究与实现[D].上海交通大学,2019.

[6]姜衡军. 端到端人机口语对话系统设计与实现[D].北京邮电大学,2018.

猜你喜欢
人机交互
某型柴油机虚拟维修系统研究
基于虚拟现实技术的九江城市交通事故模拟系统设计
人机交互课程创新实验
基于任务规划的家庭仿真服务机器人的研究
多点噪声远程自动采集系统设计
基于智能手机的盲人语言应用软件的设计与开发
基于Intel Realsense技术的感知展示系统的设计与开发
图像处理耦合模板定位的答题卡识别研究与应用
数字化控制系统人机交互的特征及预防人因失误策略
基于物联网家居安防系统的设计