人工智能核心技术浅谈

2018-01-01 10:52刘文锋
科学与财富 2017年30期
关键词:大数据人工智能算法

刘文锋

摘 要: 人工智能技术和产品已经渗透到我们工作、生活的方方面面。未来,人工智能的发展将主要依靠哪些技术推动呢?大数据、算法、超级计算这三大计算将是人工智能的核心驱动力。

关键词: 人工智能;大数据;算法;超级计算

一、人工智能的诞生历程

人工智能概念最早可以追溯到古希腊时期,在火神的故事里就提到过智能机器人与人工生物的概念。可以说,人工智能概念的雏形最早是来自科幻小说和神话故事。1942年,美国科幻巨匠阿西莫夫在其巨作《我,机器人》的引言中提出:“机器人学三大法则”,这三大法则也成为后来学术界默认的研发原则。1950年,英国数学家阿兰?图灵在《思想》杂志上发表了一篇题为《计算机器与智能》的论文。2014年,在英国皇家学会举行的一次图灵测试中,一台来自俄罗斯超级计算机尤金?古斯特曼顺利通过了图灵测试,这是图灵测试提出六十多年来首次有机器通过该测试。这台叫尤金?古斯特曼的超級计算机的33%回答骗过了裁判,让裁判以为和他交流的是人而非机器。1956年,在美国最悠久的世界顶尖学府——达特茅斯学院举行的一次会议上,著名计算机科学家约翰?麦卡锡正式提出“人工智能”一词,并说服与会者接受该词作为本领域的专用名称。这次会议也当做人工智能正式诞生的标志。

二、人工智能的定义

人工智能涉及的学科非常多。比如说计算机科学、脑科学、哲学、心理学、语言学等。学术界目前还没有统一的人工智能定义,不同研究方向的专家对人工智能的理解不一样,定义也有所侧重。目前比较通俗的定义是:人工智能就是用人工的方法在机器上实现的智能,被称为机器智能。

根据人工智能的智能水平,从低到高可以划分为三个层次,第一个层次是计算智能,就是能存会算,各种棋类游戏、专家系统体现的就是计算智能;第二个层次是感知智能,就是能听会说、能看会认,像语音助手、人脸识别、看图搜图和无人驾驶体现的就是感知智能; 第三个层次是认知智能,就是能理解会思考,这是人工智能领域专家们正在努力的方向,比如说微软小冰就具有非常初级的理解语意的能力。

三、人工智能的核心驱动力

人工智能有三大核心驱动力,大数据、算法和超级计算。

第一大核心驱动力——大数据

在人类发明的史上,很多发明都是从模仿动物开始,比如说为了实现飞行梦想模仿鸟,历史上有各种关于模仿鸟试图飞行的记载,用这种方法飞行的结果可想而知,肯定都以失败告终。于是,我们把使用这种方法论的人统称为"飞鸟派”,早期研究人工智能的基本上都是"飞鸟派”,因为他们认为计算机要获得智能必须模仿人的思考模式。比如说当时的语音识别研究,几乎所有的专家都把精力投入到教会计算机理解人类的语言上,研究进展缓慢。上世纪七十年代初,美国康奈尔大学有位叫贾里尼克的教授在做语音识别研究时另辟蹊径,换了个角度思考机器语音识别这个问题。将大量的数据输入计算机里,让计算机进行快速的匹配,通过大数据来提高语音识别率。于是复杂的智能问题被转换成了简单的统计问题,处理统计数据正是计算机的强项。从此,学术界开始意识到,让计算机获得智能的钥匙其实是大数据。

什么是数据呢?你可能会认为大数据就是一堆数字组成的,其实数据的范畴比数字大得多,网上所有的信息都可以称为数据,通俗理解,大数据就是用现有的一般技术难以管理的大量数据的集合。

大数据有三大特征:体量大、多维度、全面性。

第一个特征就是体量大。随着物联网和移动互联网等信息技术的广泛应用,人类产生的数据量正在呈指数级增长,每年以约50%的速度增长,大约每两年翻一番。第二个特征就是多维度。百度曾经发布过《中国十大"吃货”省市排行榜》。百度并没有做民意调查和饮食文化的研究,这个结果是怎么得出来的?百度是从其“百度知道”这个知识问答分享平台的7700万条和吃有关的问题里"挖掘”出来的。这些问题包含的数据维度很多,包含食物的做法、成分、价格,还包括参与问答的人的地理位置、个人信息,上网工具和浏览器等信息。百度根据这些不同维度的信息分析出各地区的饮食习惯。如果再结合每个人使用的手机或电脑的品牌型号,经常浏览或购买的商品信息,再加上居住和工作位置信息,就可以分析他们的收入情况,从而得出不同收入阶层的人的饮食习惯。

第三个特征就是全面性。2016年,特朗普当选美国总统让很多人感到意外,特朗普的当选甚至被称为当年的"黑天鹅”事件。因为选前的各种民调都显示希拉里支持率大幅领先,大部分主流媒体也看好希拉里,但是结果却大相径庭。但有家叫新创的印度公司开发的人工智能系统MogIA一直就预测特朗普将胜出。跟传统调查公司主要依靠访谈和问卷调查不同,MogIA的判断依据是收集自Google、Facebook和Twitter等网站的超过2000万个数据点,2000万个数据点采集的数据明显比传统抽样调查只有几万甚至只有几千的调查数据更为全面,更能准确的反映民众的真实想法。采集这么多数据,过去是无法想象的,但是现在我们能做到,甚至做到采集全部的数据。印度的新创公司这次就是胜在其调查数据的全面性上。

第二大核心驱动力——算法

传统的对象识别模式是由研究人员事先将对象抽象成一个模型,再用算法把模型表达出来并输入计算机。这种人工抽象的方法具有非常大的局限性,识别率也很低。幸运的是,科学家从婴儿身上得到了启发。没有人教过婴儿怎么"看”,都是他们自己从真实世界自学的。如果把孩子的眼睛当做是一台生物照相机的话,那这台相机平均每200毫秒就拍一张照——这是眼球转动一次的平均时间。到孩子3岁的时候,这台生物相机已经拍摄过上亿张的真实世界照片。这给科学家很好的启发,能不能给计算机看非常多猫的图片,让计算机自己抽象出猫的特征,自己去悟什么是猫,这种方法被称为机器学习。谷歌就采用这种机器学习方法开发出了猫脸识别系统,而且准确度非常高。

机器学习除了在对象识别领域外,在其他领域也得到了广泛使用,并取得了让人激动人心的成果。搜索引擎、语音识别技术、自然语言处理、图像识别、推荐系统、专家系统和无人驾驶技术等领域在机器学习算法的推动下取得了长足进步,机器智能水平有了很大的提升,但是理解能力和想象力仍是短板。

第三大核心驱动力——超级计算

有了大数据和先进的算法,还得有处理大数据和执行先进算法的能力。每个聪明的人工智能系统背后都有一套强大的硬件系统。目前世界运算速度最快的超级计算机是中国的神威?太湖之光,峰值性能达每秒12.5亿亿次,运算速度相当于普通家用电脑的200万倍,神威?太湖之光一分钟的运算量需要全球72亿人用计算器不间断运算32年。超级计算机一个国家科技发展水平和综合国力的反映。没有超级计算机,天气预报不可能预报15天,中国的大飞机研制不可能进展如此之快,另外,核武器的爆炸模拟、地震预警、药物研发等领域也离不开超级计算机。

云计算:一种基于因特网的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云。因此,云计算甚至可以让你体验每秒10万亿次的运算速度,计算能力堪比超级计算机。云中的单个计算机性能可能非常一般,甚至就是普通电脑,但是很多一般加在一起的实力却不能小觑,就像俗语说的三个臭皮匠能顶个诸葛亮,集腋能成裘。

大数据、算法、超级计算三者相辅相成、相互依赖、相互促进,共同推动人工智能向前发展。

参考文献

[1]人工智能技术发展及应用研究综述[J].韩晔彤.电子制作. 2016(12).

[2]人工智能及其发展应用[J].邹蕾,张先锋.信息网络安全. 2012(02).

[3]人工智能及其应用[M].石油工业出版社,尚福华等编著, 2005.

[4]人工智能概述[J].胡勤.电脑知识与技术.2010(13).

[5]奇点临近[M].机械工业出版社,(美)库兹韦尔(Kurzweil, 2011.endprint

猜你喜欢
大数据人工智能算法
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
2019:人工智能
进位加法的两种算法
数读人工智能
基于大数据背景下的智慧城市建设研究
下一幕,人工智能!
一种改进的整周模糊度去相关算法