科大讯飞:从语音到AI的前行之路

2019-08-05 07:03淦凌云卫萌
中国工业和信息化 2019年4期
关键词:语音领域人工智能

淦凌云 卫萌

从智能语音技术开始,再到人工智能技术,科大讯飞在技术领域的不断摸索中总结出了自己的路径。遵循着市场需求的导向,以产业应用为目标,科大讯飞正深入教育、医疗、政法、智慧城市、消费者、客服、汽车等多个关系社会民生福祉的行业,不断用人工智能为行业赋能。

2017年,国家出台《新一代人工智能发展规划》,首次将人工智能上升为国家战略,2018年,习近平总书记在主持中共中央政治局第九次集体学习时强调,人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应,加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。 如今在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术的驱动下,在国家政策的支持下,科大讯飞的人工智能技术与应用正在迎来价值的兑现。从智能语音技术起步,开发智能语音平台,建立中文语音交互技术标准,科大讯飞在人工智能领域逐渐成为领军者,而伴随着消费端产品持续输出,讯飞输入法、讯飞翻译机等则让越来越多人看到了中国科技企业在人工智能领域的跃进。

深度学习贯穿研发始终

上世纪90年代末,国内语音市场一片混沌,国外IBM、微软和摩托罗拉等国际巨头大兵压境、虎视眈眈觊觎市场。以刘庆峰为首的一群中国科学技术大学学生立志“技术报国”,要让“中文语音技术由中国人做到最好,中文语音产业掌握在中国人自己手中”。在导师王仁华教授的全力支持之下,科大讯飞正式成立。

回顾科大讯飞的智能语音技术研究之路,深度学习一直贯穿其中。2010年开始,中国开始进行深度神经网络(DNN)语音识别研究,科大讯飞也参与其中,并随后推出了当时在业界首个基于深度学习框架的商用中文语音识别系统。此后,为了克服语音识别系统在实验室环境准确率高、但实际场景应用准确率大大下降的问题,研发团队以1年半左右的周期持续更迭新的技术框架,勇于“革自己的命”。由于循环神经网络(RNN)开始逐渐替代传统的深度神经网络(DNN)成为主流的语音识别建模方案,2015年,全新的循环神经网络(DNN)语音识别系统全面升级。2016年,在提出前馈型序列记忆网络(FSMN)新框架后,科大讯飞结合经验再次创新性研发出深度全序列卷积神经网络(DFCNN)。在技术的不断迭代优化之下,讯飞语音识别核心效果保持每年30%的相对提升,保证了目前讯飞输入法场景识别率达到98%以上。

从智能语音技术开始,再到人工智能技术,科大讯飞在技术领域的不断摸索中总结出了自己的路径,在人工智能三个阶段中沉淀与前行:运算智能、感知智能、认知智能。

运算智能指的是机器“能存会算”,在这一阶段,机器已经远超人类了。感知智能就是让机器“能听会说”。机器想要听清人说的话,依靠的是语音识别技术。从2008年起,科大讯飞连续在国际说话人、语种识别评测大赛中名列前茅;而机器开口说话,需要的是语音合成技术,中文合成音在业界也是全世界唯一超过普通人说话水平的系统。认知智能就是让机器“能理解会思考”,认知智能也是人类所独有的,能够理解语言、进行知识表达和逻辑推理。认知智能对于机器来说,是人工智能发展的高级阶段,也是一个难点与重点。科大讯飞从2014年起就启动了“讯飞超脑”计划,专注认知智能领域的研究。

图像识别也是近年来人工智能的热门研究方向,科大讯飞虽以语音起家,但在技术方面的深度积累与互通有无的延展精神,也在计算机视觉领域收获了不俗的成果。

感知智能与认知智能紧密结合,是在实际应用中经常遇到的情况。在两方面结合的领域中,公司技术研发团队在不同領域中寻找可相互借鉴的地方,彼此成就。通过语音识别和语义理解在底层的深入融合,在语音交互上,目前已经研制完成可量产的支持远场识别、全双工、多轮交互、方言识别等特性的软硬件一体化的AIUI产品方案,显著提升了人机语音交互的成功率和人机交互开发的便捷性,已经成功在智能音箱、智能电视、智能汽车、智能家居、智能机器人等领域实现广泛的前瞻引领和规模化应用落地。在机器翻译领域,同样得益于深度学习,讯飞在多次国际机器翻译大赛中取得优异成绩。

凭借在感知智能领域的不俗实力与在认知智能领域的探索成绩,2017年,科大讯飞正式被认定承建我国首个认知智能国家重点实验室,这也是我国在认知智能领域的第一个国家级重点实验室。

保持源头核心技术的创新与领先一直是科大讯飞的立身之本,也是公司向前迈进不竭的动力源泉。技术的持续突破离不开国家政策的大力支持,对创新发自内心的热爱和敢于对研发持续大投入的魄力也缺一不可。科大讯飞董事长刘庆峰曾对员工说过:“在创业之初我们从未想过有一天语音合成效果可以做得比普通人声更好;也没想过语音识别、转写文字会超过人工记录员输入的准确率,还能实时翻译出来;更没有想过机器人能够第一个通过国家医师执业资格综合评测笔试。正是源于初心的热爱、基因里对创新的追求,还有用技术创新改变世界那种不可遏制的热情与冲劲,讯飞人才能做到这些。”在人工智能产业爆发的关键窗口期,科大讯飞也坚定不移加大人工智能技术和应用的投入力度,连续5年保持研发投入超过销售收入的20%。

源头核心技术的创新不仅要关注应用的“小波浪”——穿戴式设备、APP等,更要关注技术创新的“大波浪”——源头技术、创新算法、配套芯片等。任何时候,国家或行业发展都必须坚持“大波浪”和“小波浪”共同推进的原则。未来人工智能的突破将聚焦三个方向:一是算法突破,面对小样本、无监督、个性化问题的基础理论将持续突破;二是脑智同飞,脑科学研究和数学统计建模方法深度结合;三是人机耦合,人工智能系统和人类行为协作的人机耦合方式持续探索。在这三个方向的引领下,科大讯飞也正付诸实际行动,通过与相关高校、科研院所等长期的合作研究,力争在未来有突破的关键技术领域共同迈进。

遵循市场需求导向为产业赋能

当我们回看2016年行业对于人工智能的讨论,再对比2019年的当下,就可以发现这样的趋势——2016年人工智能相关话题还仅局限于“人工智能技术”的本体,而当时间的长河来到2019年,对于人工智能的讨论已经跨越到了人工智能技术在社会和生活中的应用。作为领先一步手握人工智能大门钥匙、提前布局扣住未来人工智能技术命脉的科大讯飞,要如何面对万物互联时代人工智能技术的全新趋势?如何探索认知智能规模应用下人工智能技术应用的布局与落地?

从自身而言,在“顶天立地”的理念下,遵循着市场需求的导向,以产业应用为目标,科大讯飞正深入教育、医疗、政法、智慧城市、消费者、客服、汽车等多个关系社会民生福祉的行业,不断用人工智能为行业赋能。

在教育领域,智慧教育产品利用自动评测和知识图谱技术,对学生课堂练习、课后作业和考试数据自动分析,为每个孩子提供各不相同的个性化作业,大幅减少无效重复训练,将“因材施教”的教育理念落到了实处。2018年科大讯飞已经为全国1000多所学校近200万高中和初中学生提供常态化个性化作业,使学生日平均每天作业时长比之前缩短了50分钟,有效提升了学生学习成绩和学习兴趣,安徽省从今年开始将建设1000所左右的智慧学校。

在医疗领域,智慧医疗产品已在全国130家三甲医院、近2000家基层医疗卫生机构落地应用。其中2017年科大讯飞与清华大学联合研发的人工智能机器人“智医助理”以456分的优异成绩通过国家执业医师资格考试综合笔试评测,使机器首次具备了全科医生的潜质。2018年它已经在安徽省四县一区推广使用,能够辅助医生看900余种疾病,上线至今,平均每天提供1.1万次辅诊建议,有效提升基层医生的诊疗水平,缓解地方医疗资源不均衡的压力,助力推进分级诊疗。它被纳入2018年安徽省33项民生工程,并被写入安徽省《2019年政府工作报告》,今年将在安徽省50个地市推广应用。

在政法领域,针对法院实际业务需求,科大讯飞打造智慧法院业务整体方案,推出智能法官助手软件、智能庭审系统、智能审委会系统等产品及应用,其中智能庭审系统率先应用到全国近30个省份、400多家法院。2019年1月23日,在上海市第二中级人民法院,全国法院首次运用“刑事案件智能辅助办案系统”辅助庭审。这个系统由科大讯飞与上海市公检法联合研制,又名“206系统”,将人工智能技术应用到侦查、批捕、审查起诉到审判的各个办案环节,在提升执法效率、防止冤假错案方面发挥了显著作用。

在翻译领域,讯飞翻译机2.0支持中文与50种语言的即时互译,还支持方言翻译、离线翻译、拍照翻译、行业AI翻译等功能,现已覆盖近200个国家和地区出境需求,每月为全球用户提供5000万+次服务,让用户通过小小的翻译机与世界聊得来。在2018年双十一的销量榜单中,讯飞翻译机2.0占据翻译机品类70%的销售份额,在京东平台用户好评率高达99%。

在媒体应用领域, 2019年两会上,科大讯飞与央视合作,打造AI记者助理“小白”,它复刻了著名主持人白岩松的声音,并学习了大量两会知识,在今年两会中持证上岗,作为记者助理向参会媒体及时提供两会信息。与此同时,讯飞听见、讯飞智能办公本、讯飞智能录音笔等产品也都深受媒体记者喜爱,成为办公的好帮手。可以说,在过去的一年,人工智能技术正不断与实体经济相融合,对人们的生产和生活方式产生深远的影响。

构建开放共赢产业生态

科大讯飞在多条行业赛道上实现应用规模化落地离不开人才的加持。然而据工业和信息化部调研统计显示,中国人工智能产业发展与人才需求比为1∶10,到2030年,人工智能相关人才缺口更是将达到500万。如何将中国这一“人口大国”转变成为“人才强国”,为人工智能产业界提供更充足的全面型人才和专业型人才,科大讯飞率先迈出了自己的步伐——2018年,公司与工业和信息化部人才交流中心和特斯联、寒武纪、第四范式等AI产业界同行达成合作,各方将在工信部人才交流中心统筹下,进一步加强产学研用合作,培养人工智能+X复合型产业人才;此外还依托与各大院校联合打造的人工智能生态联盟体系,共同探索人工智能领域人才培养的实验室解决方案(AI-LAB),通过应用双线学习场景、AI Lab实验场所等方式,构筑新时代的“人才矩阵”,为国家同步培养和提供源头创新人才、产业研发人才、应用技能人才。

为了让更多人参与人工智能浪潮中去,抓住时代机遇,自2010年起,科大讯飞就开始布局对于创新创业的扶持工作。借助自有资源,在线上和线下都建成了较为完善的双创扶持载体,创业团队可以使用科大讯飞开放的技术,结合自己的开发能力以及对市场和用户需求的理解,自行开发各类软硬件产品和服务。在线上,以开放共赢的心态规划建设人工智能产业生态云平台,将科大讯飞多年积累和汇聚的人工智能技术与解决方案开放给全国各地的创业者团队使用,目前该平台已经成为规模位居全国前列的人工智能产业生态平台,截至2019年2月底,平台平均每天通过47亿次服务为超过94万个开发团队和60余万各类应用提供技术支撑,累计终端数量超过22.8亿台,平台应用数量、交互频度、发布产品数等主要指标均位于行业第一;在线下,目前科大讯飞已在合肥、长春、洛阳、重庆、天津、西安、苏州等地建设了双创基地和AI+产业加速中心,总面积超过10万平方米,落地孵化开发者团队和公司600余家,带动就业2.6万人。

在科大讯飞提供的舞台上,通过技术赋能、市场赋能和投资赋能等方式,人工智能技术正成为像水和电一样即插即用的资源,千万创业者正在以极低的成本和较高的起点开始自己的双创事业,在他们之中就诞生了优必选、商汤、寒武纪、云迹、狗尾草等一批人工智能行业的知名企业。刘庆峰曾表示,“封闭的帝国终会衰落,唯有生态生生不息”。因此科大讯飞不仅要拥抱人工智能技术的浪潮,还期待通过打造AI全领域开放平台,携手合作伙伴共同持续构建健康良好、共创分享的人工智能产业生态,进一步触达更多智能设备,搭建应用场景、服务每个用户,用科技的力量推動社会进步。

责任编辑:张煜

zhangyu@ccidmedia.com

猜你喜欢
语音领域人工智能
微信语音恐惧症
2020 IT领域大事记
领域·对峙
魔力语音
Magic Phonetics魔力语音
2019:人工智能
对方正在输入……
人工智能与就业
2018年热门领域趋势展望
数读人工智能