人工智能,我们还有多远的路要走

2017-10-27 13:46刘宇阳
出版参考 2017年9期
关键词:语音人工智能智能

刘宇阳

8月8日21时19分,四川九寨沟县发生7.0级地震。21时57分15秒中国地震台网机器人自动编写稿件,仅用25秒出稿,540字并配发4张图片。内容包括速报参数、震中地形、热力人口、周边村镇、周边县区、历史地震、震中简介、震中天气八大项。25秒能做什么?当人类记者还处在惊愕中时,机器人已经迅速完成了数据挖掘、数据分析、自动写稿的全过程。

写稿机器人正是一种人工智能。它用机器代替人完成实时监控信息源,利用文本解析和信息抽取技术实现自动信息抽取,采用机器学习算法并融合编辑记者团队的经验和智慧,以模板和规则知识库的方式,根据实时抽取的信息作出判断,输出相应的模板及规则知识库内容,从而产生新闻,以此应对海量、高速、多样的大数据产生的信息。

1956年夏,以麦卡赛、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,它标志着“人工智能”这门新兴学科的正式诞生。人工智能,简称AI,是研究使计算机来模拟人的某些思维过程和智能行为的学科,该领域的研究包括机器人、语言识别、图像识别、自然语言处理等。人工智能与基因工程、纳米科学被称为二十一世纪的三大尖端技术,几十年来,它的迅猛发展使得很多应用它的领域都取得了令人刮目相看的成绩。人工智能本身无论在理论和实践上都已自成一个系统,逐步成为一个独立的学科分支。

目前,人工智能的应用已经非常广泛,各大新闻客户端会根据你的阅读兴趣推送相关新闻、各大电商平台会根据你的购买习惯推送相关商品、几乎所有你浏览的网页所呈现的广告都与你的历史搜索相关……这些都可以称得上是人工智能。而且,与过去60年人工智能的发展主要集中在实验室里不同,新一轮的人工智能已经在诸多应用场景中发挥威力,应该说,新一轮的人工智能浪潮才刚刚开始。从大数据到云计算到人工智能已经具备了相对坚实的基础。其中,大数据称得上是人工智能赖以开展的生产资料,而云计算则是人工智能发展的生产工具。不过,从当下人工智能的发展现状看,大部分的人工智能还停留在大数据分析阶段,距离真正的人工智能还有一定的距离。人工智能时代已经起航,“加速前进”的人工智能会否是新一轮产业革命的推动力?其标准又是什么?在这次技术变革中,新闻出版业是否可能实现弯道超车?这些,都是人工智能浪潮留给我们的思考维度。

人工智能的技术应用有哪些?

随着大数据、物联网、人工智能、虚拟现实等新技术、新产业不断涌现,特别是实体经济与信息技术加速融合,持续催生出新的增长点。互联网发展进入了创新加速、智能转型等新阶段。随着各项技术的突破,人工智能各项应用应运而生。近年来,世界各国如美国、英国、日本、俄罗斯等纷纷制定了人工智能国家发展计划,我国相继出台了《“互联网+”人工智能三年行动实施方案》《中国制造2025》《新一代人工智能发展规划》等,建立一级人工智能学科的呼声一浪高过一浪、此起彼伏。

1.计算机视觉

计算机视觉是机器认知世界的基础,也是最主要的人工智能技术之一。2016年,Alpha Go战胜韩国围棋选手李世乭再次引爆了全球对于人工智能的讨论和关注。计算机视觉受到深度学习的成功影响在近几年内取得了突破性的进展,正在成为影响行业发展的下一个引擎。巨头纷纷布局,市场也吸引了越来越多的创业人才参与其中。計算机视觉正在成为人工智能最火热的细分领域之一。

人类认识了解世界的信息中91%来自视觉,同样计算机视觉成为机器认知世界的基础,终极目的是使得计算机能够像人一样“看懂世界”。目前计算机视觉主要应用在人脸识别、图像识别方面(包括静态、动态两类信息)。

2.语音识别

在人工智能快速发展的今天,语音识别开始成为很多设备的标配,语音识别开始被越来越多的人关注,国外微软、苹果、谷歌、nuance,国内的科大讯飞、思必驰等厂商都在研发语音识别新策略新算法,似乎人类与语音的自然交互渐行渐近。

我们都希望像《钢铁侠》中那样智能先进的语音助手,在与机器人进行语音交流时,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

3.自然语言处理

人工智能技术的演进可以概括为三个层次:感知智能、认知智能、通用智能。目前AI技术正从感知迈入认知阶段。而感知智能是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备,借助语音识别、图像识别等前沿技术,映射到数字世界,再将这些数字信息进一步提升至可认知的层次,比如记忆、理解、规划、决策,等等。而在这个过程中,人机界面的交互至关重要。

丢一块石头到水里会发生什么?人工智能可以战胜围棋大师,却会被这样的简单问题难倒——对自然语言的处理仍是一个待解难题。语言智能是人工智能“皇冠上的明珠”,如果语言智能实现突破,跟它同属认知智能的知识和推理就会得到长足发展,进而推动整个人工智能体系的进步。自然语言是不精确的,字面背后还有太多意思,这也是为什么自然语言处理如此困难的原因。自然语言处理若想突破,需要做出范式上的改变。

4.机器人

机器人早在人工智能一词出现之前就已存在,但那时的机器人,大多都是没有认知能力的,只是在功能上简单模仿人,给人的印象很“死板”。现如今,人工智能赋予机器人语义、认知、理解等能力,给机器人带来了无限可能。endprint

人工智能把外界输入的信息向概念逻辑信息转译,将动态和静态的图像、文字、声音等信息转为形式化的概念逻辑信息,实现信息的识别转换;人工智能对接收的信息进行不断的自我学习、深度检索、逻辑判断,达到深度学习,下次遇到这种问题可以直接做出相对应的智能反应,加快处理速度和智能应对,实现数据的智能运算;人工智能通过算法和运算对实体进行控制……所以,在人工智能的大环境下,势必会引领机器人从“呆板”向“智能”转变,将会赋予机器人语义、视觉、听觉等能力,将机器智能与人工智能结合,成为真正意义上的人工智能机器人。

5.机器学习

机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。写稿机器人是当下机器学习的最亮眼的实现形式之一,在新闻出版领域发挥着重要作用。

世界各国纷纷制定人工智能国家发展计划

人工智能机器人应用前景广阔、用途多样,逐步渗透到数字新闻领域,采访智能机器人走进直播间、电视频道、媒体网站,写稿机器人融进小说家家族、编辑行业,带来了媒体资源的重新洗牌,逐步迎来了数字新闻报道人机有机结合智能化新时代。

1.人工智能已经上升到国家战略,中国多部委联合推动

近年来,多个国家部委颁布文件从政策上大力支持人工智能发展,给业界带来诸多期待。特别是新闻出版业,有望在人工智能的帮助下实现跨越式发展。

2016年5月18日,国家发改委、科技部、工信部、中央网信办发布了《“互联网+”人工智能三年行动实施方案》。该方案提出到2018年,将打造出人工智能基础资源与创新平台,并基本建立人工智能产业体系、创新服务体系、标准化体系;在重点领域将培育若干全球领先的人工智能骨干企业,初步建成基础坚实、创新活跃、开放协作、绿色安全的人工智能产业生态,形成千亿级的人工智能市场应用规模。

2016年7月28日国务院印发《关于“十三五”国家科技创新规划的通知》。《通知》对人工智能的发展也提出了新的展望。建立重大项目动态调整机制,综合把握国际科技前沿趋势和国家经济社会发展紧迫需求,在人工智能等方面遴选重大任务,适时充实完善重大项目布局。重点发展大数据驱动的类人智能技术方法;突破以人为中心的人机物融合理论方法和关键技术,研制相关设备、工具和平台;在基于大数据分析的类人智能方向取得重要突破,实现类人视觉、类人听觉、类人语言和类人思维,支撑智能产业的发展。

2017年7月20日,《国务院关于印发新一代人工智能发展规划的通知》发布。该规划提出了中国人工智能三步走的概念,定下了详细的时间表和路线图。第一步,到2020年人工智能总体技术和应用与世界先进水平同步。初步建成人工智能技术标准、服务体系和产业生态链,培育若干全球领先的人工智能骨干企业,人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元。第二步,到2025年人工智能基础理论实现重大突破。新一代人工智能在智能制造、智能医疗、智慧城市、智能农业、国防建设等领域得到广泛应用,人工智能核心产业规模超过4000亿元,带动相关产业规模超过5万亿元。第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。

2.美国国家人工智能发展与研究战略计划为人工智能的未来做好准备

中国人口基数大,移动互联网发展迅速,有庞大的数据资源优势。另外商业化应用场景丰富,在人工智能应用领域将出现更多突破。但在基础算法和理论研究方面,与早于中国布局人工智能的美国还有差距。美国国家人工智能发展与研究战略计划于2016年10月13日公布,该报告由美国国家科学委员会下属的机器学习与人工智能分委员会指定的人工智能研究组制定,其目的在于向整个国家提供一个跨部门的指导人工智能发展的战略导向。同时,美国总统行政办公室和科学技术委员会也同步发布了另一份报告《为人工智能的未来做好准备》,更多的从政府与治理的角度探讨人工智能的挑战与政府治理问题。这份报告包括简言、公共物品与人工智能、人工智能在联邦政府的应用、人工智能与管制、人工智能与安全等主题。

人工智能给新闻出版业带来什么?

近年来,新闻出版业产业融合稳步推进,数字出版产业持续升温,人工智能技术成为业内大热门。人工智能将在新闻出版产业的融合发展中扮演什么样的角色引发了业界的持续关注。刚刚结束的2017中国互联网大会上,工业和信息化部部长苗圩表示将加强对关键核心技术攻关突破,加快人工智能、虚拟现实等技术的研发和商用。他还表示,将推动互联网与其他产业跨界融合创新,加快构建普惠性、精准性创新支持政策体系,打造以市场服务为纽带、以价值链共创为基础的市场化运行机制。随着各项技术的突破,人工智能各项应用应运而生。直面智能时代的挑战,如何实现人机结合,是每一位数字新闻工作者亟待思考的问题。

1.通过数据找选题更容易

出版在整个经营和内容生产中将面对很多的数据,比如在经营中,图书信息、作者信息、销量信息、评价信息、读者信息,以及用户行为信息等,都可以通过大数据帮助出版单位进行选题营销决策。

北大方正电子有限公司副总裁刘长明曾表示,人工智能意味着一场数据的革命。当前发展时期,新闻出版领域内的人工智能在算法层面已经取得重大突破,高质量且完善的数据资源集成为急需补充的稀缺资源。具体到出版而言,他认为通过数据服务,能帮助编辑进行更有效的選题策划。

大数据还可以重塑内容分发机制,基于大数据的智能分发和个性化推荐,可以做到千人千面,或者每个人都可以享有自己关注的内容。围绕出版大数据解决方案,可以满足选题的优化,通过数据的分析和挖掘,在内容出版的发行和精准营销上也能起到很好的支撑作用。方正目前已经构建了自己的大数据中心,为五六十家传媒单位提供服务,他们也希望在出版领域,面向图书的营销、选题策划以及内容的分发方面,提供相应的服务。endprint

2.内容定制实现高品质阅读

在内容生产阶段,人工智能能够协助作家进行资料分析与用户研究,协助作者进行创作,甚至进行机器创作。在内容传播阶段,人工智能能够通过海量的数据分析,为用户提供个性化的推荐与解决方案。在内容消费阶段,以业务为载体,人工智能融合全息投影、语音阅读、人工智能体验等技术,全面提升阅读展现形式和内容呈现模式。

中国移动咪咕数字传媒有限公司总经理张燕鹏认为,人工智能时代里,数字阅读将迎来一场全新的创新变革。“未来的阅读会根据用户的个体差别以及个人喜好进行内容的定制,实现高品质的阅读享受。”张燕鹏说,咪咕阅读目前就已经能够实现多场景、多角色的智能配音,并对人的语言进行模仿。“不同的用户还可以选择自己所喜欢的语音语调,让1000个读者读出1000个哈姆雷特。”他认为,通过人工智能,借助全息成像、增强现实等技术,将来可全方面实现故事情节的全息投影与全新阅读,为读者带来全新的阅听感受。

3.人工智能将重塑出版流程

人工智能对新闻出版业的影响是深远的,在它慢慢对整个产业渗透的进程中,不光编辑、印刷、发行环节受其影响极大提升了工作效率,在数字出版、数据挖掘与加工等细分领域也得到了广泛的推广——人工智能从一定程度上对出版业的流程进行了重塑。语音识别、数字编辑、机器学习等技术成功再造了出版流程,在完善人机交互的流程中也极大地提升了用户体验。

龙源数字传媒集团副董事长汤杨提到人工智能在出版领域的应用时曾表示:“过去的出版社编辑做一本书需要的时间很久,随着人工智能技术对出版产业的渗透,编辑的工作效率会得到大幅度提升,可能只需要一天的时间就可以完成一本书的编辑。”同时,人工智能在出版流程的再造方面也提供了很多可能,比如语音录入、机器协助校稿、机器写作;在增强用户交互体验方面,很多机器在出版行业也得到逐步应用。

以编辑图书为例,龙源旗下有一个人工智能平台“知识树”,当编辑定义了一部分内容以后,系统会自动帮他组成剩下的内容。同时,“知识树”利用龙源背后数千万篇文章的积累,能够让旧的内容焕发出新的活力。最为关键的是,龙源已经获得了这些文章的授权。在“知识树”的帮助下,编辑可以用一个半小时编辑一本书,再用一天时间去发行。汤杨介绍,目前龙源已经与亚马逊、当当、京东进行了对接,并且这些内容可以输出到现在数字出版几乎所有的分发渠道,比如今日头条等,流量在哪里,内容就可以被输出到哪里。

理性看待人工智能的局限

人工智能发展历史上有过两次发展瓶颈。第一次泡沫破灭是因为人们发现当时的智能系统如逻辑证明器、感知器、增强学习等,只能做很简单、非常专门且很窄的任务,稍微超出范围就无法应对,这让智能系统不足以解决任何实际的问题。第二次泡沫破灭也是因为专家系统所能解决的问题非常局限,远远无法达到人们的期待。目前看来,人工智能离取代人类还有很长的路要走,人机协作是必然趋势。

1.人才、数据、计算平台是当前制约人工智能发展的三大因素

人才是发展的第一资源。在新闻出版传媒领域,人工智能时代带来的一系列创新应用,给新闻出版的生产、编辑、模式带来了全方位的变革,对人才需求提出了更高的要求。人工智能对人才的要求程度较高,特别是新闻出版业,需要对技术、出版流程、商业有着深刻的理解;当下国内外顶尖企业都在不惜代价招揽人工智能人才,说明人才的稀缺性和珍贵性;人才的缺乏将制约人工智能的发展。

数据是人工智能的基础。对新闻出版行业而言,只要掌握了自己领域所针对的庞大数据资源集,就能成为出版企业转型升级的重要竞争力。特别是对传统出版单位而言,数据的来源比新媒体和高新技术企业在多样性上已经落后。人工智能的发展需要大量的数据,进行不断的验证和优化,这些数据涵盖了社会的各个层面;传统出版单位由于行业、企业等特性,目前虽然已经积累了大量的数据,但数据仍旧存储在不同的服务器中,难以得到共享及优化。

计算能力决定人工智能的发展进程。当前市场对现有的芯片和算法提出了新的需求。人工智能对计算能力的需求以及计算成本,导致行业巨头成为主角;计算能力的提升以及成本下降才能吸引更多参与者。人们对人工智能的最大期待是不断提升系统的智能水平,让智能系统逐步拓展能够处理的问题范围,最终实现通用人工智能系统,解决几乎所有领域问题。但由于算法等一系列原因,现实的系统尚无法达到人们所想象的智能水平。

2.人工智能尚不能完全取代传统新闻出版人的工作

北京师范大学教授喻国明谈到人工智能的发展与传媒格局变化的逻辑时曾讲到:“现阶段人工智能发展的关键问题是人和机器如何在人机对话中实现功能的互补和价值的匹配。人工智能的特长在于,对于海量的资讯素材在规格化、模式化的处理,在数据方程和自学习能力可以达及的功能逻辑上,能够显出极高的效率和精准的处理。但是,在大跨度的复杂变量的处理和判断方面、在微妙情感关系的处理和表达方面,尤其是在价值规则的制定和参照框架的选择方面,人的智能和介入不可或缺。因此,这便是未来媒体人的价值和核心竞争力之所在。”

与慢慢渗透传统出版流程的人工智能出版相比,传统出版人和新闻人最大价值在于对事实的判断以及对复杂逻辑关系的推理,这是作为一个出版人和新闻人本身创造性的体现,也是人工智能所暂时不具备的能力。现阶段,新闻出版业的人工智能主要应用在一般新闻采写和数据分析,还不太可能完全取代编辑的工作,它们只是为了将出版人从单调、重复的工作中解放出来,去关注那些更加复杂,更加需要人类思考的东西,同时也能降低工作的时间成本。这也意味着,具有经验和思想的传统出版人对于整个新闻行业仍然起到支撑的作用。

3.具有人性境界的深度作品需要传统出版人

出版人要依靠科技的力量,但不能成为科技的奴隶。现阶段,人工智能在新闻出版领域完成的工作多数是数据的分析和应用,人工智能技术还很难应对具有显著人类主观意识影响的社会文化和意识领域的各类问题,缺乏打动人的、有情感的细节。复杂、跨界、有深度的、情感的表达更为细腻的出版生产流程仍然需要传统出版人。此外,质疑、追问、寻找出版流程中的线索和灵感,也是传统出版人法宝。

具有創新能力的出版人将成为人工智能时代的强者。人工智能出版的出现,其实为传统出版人提供了更上一层楼的动力和机遇。对于每一个出版人来说,只有更深入地了解出版行业以及人类获得信息渠道、人类思考方式的本质,加深人工智能领域的人文探索,才能使人工智能更好地为我们所用。

在智媒体时代,能够生产优质的、深度的、有观点、有分析的作品的出版人更加珍贵。人机协作是必然趋势。未来的出版物背后也许都会站着一个人类编辑和一个虚拟编辑,透过不同的视角看世界。endprint

猜你喜欢
语音人工智能智能
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
人工智能与就业