智能问答系统的发展历史和应用前景探讨

2019-10-21 10:26程俊涛李健博
科学与信息化 2019年2期
关键词:自然语言处理知识库

程俊涛 李健博

摘 要 智能问答系统发展至今经历了三个阶段:基于结构化数据的发展阶段,基于自由文本数据的发展阶段,基于问题答案对数据的发展阶段。而第一个阶段又分为人工智能阶段和计算机语言学阶段。无论是日常生活中的查阅资料,还是在科学研究、商业金融等领域的应用都有智能问答的参与,所以智能问答的发展与管理将是人们不可忽视的研究方向。

关键词 智能问答;自然语言处理;知识库;金融领域;sector

1 智能问答的发展历史

智能问答的历史可以追溯到70年前,计算机科学之父阿兰·图灵早在1950年就指出了一种验证机器是否具有智能的方法——图灵测试。在此之后的20年里,这项研究没有取得任何进展。

后来计算机科学家开始用计算机算法描述自然语言的语法规则。但是人类的语言十分复杂,而且人类的语言不一定符合语法,所以科学家不可能描述所有的语法规则。而且自然语言中存在着大量的一词多义以及常识性问题,计算机无法处理。例如计算机科学家明斯基曾经指出的两个句子,“The pen is in the box.”和“the box is in the pen.”。因为人们有常识,盒子不可能在钢笔里面,所以很容易理解第一个pen指的是钢笔,第二个pen指的是围栏。然而这会让计算机很“困惑”。

20世纪70年代后,计算机科学家首次用数学和统计的方法研究自然语言,取得了巨大进步。简单来说用统计语言模型判断一个句子是否合理,就是判断其出现的可能性大小。显然统计全世界每句话出现的概论是不可能实现的,所以俄国数学家马尔科夫提出了马尔科夫假设,后人将其完善称为N-1阶马尔科夫假设。简单来说文中某个词出现的概论只与其前N-1个词有关,这样既简化了实际问题,使计算每个词出现的概论成为可能,又保证了模型的准确度[1]。

20世纪90年代,随着计算机运算速度的提升和获取大量数据的便捷性,又诞生了基于机器学习的自然语言处理,这是一种不依赖于规则设计的数据学习算法,通过数据学习构建分析系统,不依赖明确的构建规则。机器学习事先不给出任何假设,一个预测模型中假设越少,预测效果越好。

2 智能问答系统的成果

如今智能问答系统蓬勃发展,取得了很大的突破,普遍应用于人们的日常生活之中。市场上的智能问答的产品大致分成三类:第一类是以各大电商为首的智能客服机器人,主要用于回答顾客购买商品相关疑问,解决普遍的问题。第二类主要是以完成用户指令,辅助用户完成任务为目的的产品,用户可以命令它们打开应用程序,为自己设置日程提醒,查询天气等。第三类是像微软小冰这样的产品,微软赋予它自我学习能力,赋予了人工智能创造的能力。

第一类问答系统并不具有智能,完全依靠大量的人力去维护它,更新它的知识库才能使用。第二类智能问答系统基于机器学习和人工智能,专注于完成用户的命令,有一定的学习能力,但是在理解人类语言,与人类友好交互的方面存在不足。第三类智能问答系统的优势正是有好的交互性,以微软小冰为例,恰好是与人类聊天,进行情感交流,使对话进行下去而不是尽快结束对话。

3 智能问答在金融领域的应用

在金融领域,投资者往往想最快速度的捕获信息,并进行信息的提取和分析,而且投资决策往往是非常复杂的,把金融解释成“速度的游戏”其实也不为过,所以金融领域的智能问答更偏向于投资顾问+智能问答这两者的结合,这是一种对于企业基础业务的分析,提取观点,挖掘知识,从而辅助决策。更加具体地说就是把智能问答作为基础,在这个基础上加以框架和数据进行智能分析与解答。所以总的来看在技术层面就包括了两个部分,第一个是对于知识数据库的搭建,由于现在互联网产业发达,信息量大,所以对于有效信息的知识数据库的构建就显得尤为重要,搭建知识数据库,可以在相关材料收集之后的基础上进行整合。第二个部分就是用户如何能够使用智能问答系统,首先就是对问题的解析,然后根据系统的分析给出想要的结果。这种方式不仅可以给用户节约大量的收集信息的时间,而且还能提供系统分析的数据供用户参考。

在金融领域,智能问答的发展可以说是相当迅速的,在如今这个大数据时代,大量数据所带来的也可以是巨大的知识库,這就为问答技术提供了数据知识基础,与其说是新的技术,也可以解释成一种新的产业,所以当今的智能问答,不止于此。

4 结束语

在互联网产业飞速增长和数据爆发的大背景下,当我们想让大量数据快速转换成有用信息的时候,我们往往需要一种智能的模式来满足我们的需求,而对于乘着互联网浪潮的智能问答系统,正是用户所需要的。与其说智能问答是一种技术,不如说是一种模式,给用户更好的体验,让繁杂的数据变成有效的信息,进一步转化成智慧,正是智能问答所能够完成的,也是我们所期待的智能系统。

参考文献

[1] 吴军.数学之美.第2版[M].北京:人民邮电出版社,2014:207.

作者简介

程俊涛(1998-),男,河南人;首都经济贸易大学信息学院16级信管。

李健博(1998-),男,北京人;首都经济贸易大学信息学院16级信管。

猜你喜欢
自然语言处理知识库
编辑精选APP
我国机构知识库内容质量服务探讨
相关度排序的知识库检索排序方法研究
面向服务的专业知识库平台建设与应用
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
词向量的语义学规范化
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析
基于Lucene搜索引擎的研究