科大讯飞语音王国的骄傲与焦虑

2018-05-30 14:47程建兰
科学大观园 2018年2期
关键词:刘庆峰语音人工智能

程建兰

2017年11月15日,科技部公布首批国家新一代人工智能開放创新平台,科大讯飞是四大平台之一,与BAT平起平坐。人们在问:为什么是它?

在科大讯飞工作群,如果有人说:“哇,我今天拿下一个一亿的单子。”没人吱声;如若有人说:“嗨,我把语言输入的准确率提高了1%。”哇,群里顿时炸开了。

这个段子,生动地表达了一个以研发为主的科技公司的基因。

2017年12月11日,科技部下发通知,批准建设一个认知智能国家重点实验室,依托单位是科大讯飞。2017年11月15日,科技部公布首批国家新一代人工智能开放创新平台,科大讯飞是四大平台之一,与BAT平起平坐。当月,安徽省专门出台了《关于支持“中国声谷”建设的若干政策》,提出到2020年,力争“中国声谷”企业营业收入达到1000亿元,年均增长40%,引领“中国声谷”建设。

安徽省将设立总规模50亿元的智能语音及人工智能产业发展基金,支持智能语音和人工智能项目。1000亿元,是2017年11月22日科大讯飞冲破早盘的市值。做为“中国声谷”的龙头企业,科大讯飞被寄予厚望。

押注语音生态圈

在创始人刘庆峰眼里,科大讯飞的成长路线图是怎样的?

2015年1月的《创业家》杂志,刊登了刘庆峰的口述文章《科大讯飞:押注语音生态圈》。这篇文章系统地展现了刘庆峰对科大讯飞成长的路径规划。

“创业初期,讯飞曾经尝试过做直接面向C端的产品,但产品叫好不叫座,没办法销售出去。受挫后,我们意识到,直接做消费者市场化有些理想,应该让有渠道、有市场、有技术的大公司去直接面对消费者。我们准备像Intel一样,专注做好iFIy inside。换言之,讯飞只负责开发引擎,语音合成、语音识别芯片,而应用集成则由下游开发商或客户自己完成。”

2000年初,科大讯飞成为华为语音合成技术供应商,不久,中兴、鑫泰、神州数码等的语音技术服务订单接踵而至。2000年底,讯飞迅速发展了近50个稳定的企业客户。在刘庆峰看来,这是讯飞发展史上里程碑式的事件。

“但真正难突破的是源头技术的创新,之后才是应用的创新。这就好比如果没有3G、4G等基础通信技术的发展做支撑,就不会有现在移动互联网对传统产业模式的颠覆。但很多人都不去想未来创新的真正源头到底在哪儿!”

这是刘庆峰2015年的一番感叹,放在当下的语境依然适用。

2017年8月,讯飞在合肥召开的投资者交流会上,刘庆峰说:“讯飞的股价在不断地上升到新高度,但越是这个时候,我越想告诉大家,讯飞是一家立足于长远发展的公司,我们希望坚守在创业主道路上,按照真正的创新规律和商业逻辑去做事。”

“当前,科大讯飞最关键的不是如何压缩投入,而是在人工智能的战略机会窗口期,敢于在核心技术产品研发上重兵投入,为未来更大规模的爆发做好准备。”刘庆峰说。

财报显示,科大讯飞2017年上半年研发投入5.11亿元,而2016年讯飞研发投入占到其销售的25%。讯飞高级副总裁兼董秘江涛透露:科大讯飞的研发投入已连续5年占销售收入25%,为全行业研发投入比最高;公司持续加大了在医疗、公检法、智慧城市、开放平台这些重点方向的研发和市场布局投入。

“平台+赛道”式公司战略

在8月份举行的投资者交流会上,刘庆峰详解了科大讯飞的人工智能战略,将其归纳为强化“平台+赛道”模式。

科大讯飞早在2010年就搭建了全球首个语音开放平台。这个平台就是科大讯飞把人工智能核心技术开放出来,整合后台的内容和服务,构建持续闭环的生态系统。

AI的工具化、平台化是必然结果。这是刘庆峰对于语音生态圈的阐述:“语音的特点,决定了语音产业要构建更好的生态,围绕语音衍生出很多应用,必须搭建平台,让更多人通过自我创新从中获益。讯飞希望扮演一个发动机的角色,不断创造出全新技术,从语音合成到讯飞语音云,到声纹识别,到口语评测,到翻译,到自然语言处理和图像人脸识别技术。

在这个语音生态产业链中,刘庆峰希望未来讯飞能够掌握主导价值链关键环节,通过持续不断的源头创新,将这一生态做大。

科大讯飞透露的信息显示,截至2017年11月,讯飞开放平台第三方开发团队已经增长到46万,每天请求数从原来的每天24亿次增长到40亿次,累计终端数达到15亿。为提升平台的运营和价值转化能力,平台之上开辟了新的板块——AI生态平台。运营总监王肃晨带领10人左右的团队,为平台上的创业者提供孵化服务,工作已有成效。“比如,我们发现创业团队中有一家杭州公司,做普通话教育评测,我们把它推荐给讯飞教育事业部,由教育领域产业导师与其进行一对一沟通,从技术、产业方向、渠道上扶持这家公司成长。” 王肃晨说。目前,孵化出来的初创公司,有的估值已上亿。

现在,这个平台已经成为业界主流的数字广告平台,江涛在乌镇互联网大会接受媒体采访时透露,这个平台2017年前三季度收入同比增长241%,说明这个开放平台的商业模式已得到验证。

在开放平台之外,分赛道也在布局中。其中,教育是重中之重。这是科大讯飞主营三块业务之一。2016年年底,科大讯飞将旗下业务拆分成教育、智慧城市和消费者三个事业部,三分之一的员工都在做教育。

科大讯飞在教育领域布局早,积累的优势间接使得部分竞争对手息战。如以口语测试切入市场的思必驰,2014年将该业务剥离出去,转型做车载、智能家居和机器人。

“这两年,明显感觉讯飞在教育上发力。”一位讯飞的同业者说,“它的产品线很丰富,不局限在语音这块,包括收购的、投资的公司,组合的产品线覆盖从课堂到课后再到学校管理的方方面面。它会针对政府采购,尽可能提供产品。”

根据2017年半年财报,科大讯飞投入教育方向的费用同比增长21.27%,教育板块营收同比增长57.71%,毛利同比增长105.56%。

而教育行业的关键特色——非标准化给科大讯飞构筑了天然屏障,这让BAT互联网企业很难施展他们赢者通吃的那套打法。

在科大讯飞深入的教育信息化领域,国家每年采购经费超过1万亿元,而讯飞的营收占比约为千分之一。“这并不代表市场有多大的增长机会,而是代表行业极度分散。”一位业者说。

另外,科大讯飞在智能客服行业,在运营商、金融领域的应用持续渗透,江涛透露该领域的营收和毛利都呈现50%以上的快速增长。

从2016年开始,科大讯飞开始发力医疗领域,已在智能语音病历、影像辅助诊断等场景落实应用。

根据科大讯飞2016年财报,其排名前三的产品依次为教育产品和服务(27.44%)、信息工程(25.07%)和电信增值产品运营(12.17%),其中人机交互产品和解决方案占营收的4.82%。

江涛在投资者交流会上透露,教育业务已逐渐进入收获期,与2016年同期相比,2017年上半年教育业务方面的营收增长了57%,毛利率大幅提升12.9%。

科大讯飞正加速占领教辅市场。现在,科大讯飞的智慧课堂已经覆盖全国2100所学校,主打个性化学习系统的智学网覆盖全国12000所学校。但也正是这一点,质疑者认为“科大讯飞只是一家教育领域的科技公司”,理由是最受普通投资者关注的智能硬件产品,只占科大讯飞总营收的1%。

这也是科大讯飞面临的拷问——在人工智能的科技变革中,到底拥有多少核心技术的独占性?

为什么能与BAT平起平坐

很多人看不明白的是,为什么国家布局人工智能四大平台,以科大讯飞这样的体量,何以能够和百度、阿里、腾讯三大巨头平起平坐?

人工智能是当前最为重要的技术社会变革,各国对此的布局体现了国家战略。普华永道数据,2030年,人工智能将给中国带来20%左右GDP的增长。腾讯研究院出台《中美两国人工智能产业发展报告》显示,美国的AI产业布局,基础层、技术层、应用层都有涉及,尤其是在算法、芯片、数据等产业核心领域,积累了强大的技术创新优势,各层级企业数量全面领先中国,相较而言,中国巨头主要集中在应用层面,在基础元器件、基础工艺等方面差距较大。

从投融资看,美国投资者对基础层更为看重,融资占比排名前三的领域为芯片/处理器 31%,机器学习应用融资21%,自然语言处理融资13%,而中国只在自动驾驶、计算机视觉、图像等领域应用较多。

在基础研究方面,科大讯飞还创造了很多项不为外界所知的世界第一。

1. 2017年科大讯飞在国际医学影像领域的权威评测LUNA上获得平均召回率92.3%的检测效果,获得第一名并刷新世界纪录。

2.由斯坦福大学发起的SQuAD挑战赛,科大讯飞与哈工大联合实验室提交的系统模型夺得第一名。

3.在2017年7月初的国际语音合成大赛上,科大讯飞连续第12年夺得该项赛事第一名。

4.不久前,讯飞智医助理以高分通过医生执业资格考试,跟前面提到的法院检察院智能辅助量刑辅助审查一样,都是全球第一例。

在上述这些赛事中,科大讯飞都是和微软亚洲研究院、谷歌、Facebook、 Salesforce以及来自斯坦福大学、卡内基梅隆大学等高校团队同场竞赛。这样的成绩,足以说明科大讯飞在基础研究上的实力以及核心技术上的领跑地位。

虽然BAT也在进军语音识别领域,但目前科大讯飞可识别22种方言。由于积累时间长,其在方言识别上的能力,BAT还无法企及。

科大讯飞也在加紧构筑其他技术壁垒。“讯飞超脑”计划便是重要一环。如它研发的MORFEI麦克风,不像苹果Siri只做近场语音识别,而能在5米距离范围,开展远场语音识别,这是目前很多场景真正需要的。

语音王国的焦虑

但科大讯飞面对的挑战也是巨大的。

最直接的质疑莫过于其近20年构筑的技术壁垒会否在互联网企业快速迭代的模式下很快瓦解。

虽然科大讯飞早在2010年就搭建了全球首个语音开放平台,但BAT正以互联网速度追赶,差距在不断缩小。新的冲击来源于百度的免费平台战略:百度宣布语音技术全系列永久免费。紧接着,2017年12月8日,百度與高通达成战略合作协议,百度的人工智能语音系统将进入高通骁龙系列平台的芯片解决方案。这些,让“保卫科大讯飞”这样的社会舆情持续发酵。语音是下一代人机交互的入口,百度这样的巨头把语音技术作为切入点加速向各个场景渗透,向高通这样产业链上的关键公司渗透。

作为最早做语音处理的企业,讯飞无疑具有先发优势。但现在,随着移动端重要性凸显,语音处理业务需求越来越大,百度、腾讯、搜狗都开始做自己的语音技术。一方面是他们需求量大,另外谁也不想把产品支撑落在他人手上。科大讯飞虽有先发优势,但BAT正以互联网的速度追赶。在这样凌厉的攻势下,公众担心的问题是,讯飞能否保持技术优势?

在司法市场,竞争也很激烈。今年8月,杭州成立全国首家互联网法院,阿里云提供了整套AI技术。腾讯也已将AI运用于裁判环节,通过人工智能技术自动给法官推送同类案件,以此辅助法官量刑。

从2016年开始,科大讯飞开始发力医疗领域,已经在智能语音病历、影像辅助诊断等场景落实应用。这些垂直类产品,不外乎是整合核心技术,行业专家的经验值和行业大数据精准分析打磨出来的人工智能产品,以此给传统行业赋能。腾讯、阿里、华为、浪潮都是这些市场的争夺者。

面对这些舆情,科大讯飞迅速做出回应,刘庆峰的回应是:人工智能空间广阔,完全容得下千帆竞发的产业生态。

刘庆峰在向公众传递的信息中,加重了对2C未来产出率分量的表述。2017年3月,他在湖畔大学谈到:“光做2B不行,一定要做2C把想像空间打开。未来2C的业务收入要占半壁江山。”

除了产业落地能力,科大讯飞还面临着人才之争。尽管在去年年中的投资者交流会上,科大讯飞透露,公司2017 年上半年从外部引进人才3500 名,其中有行业属性的关键人才接近100 名。 但科大讯飞在薪酬上的竞争力明显不如BAT。目前,科大讯飞的生源地主要是中科大,公司六成技术人员毕业于中科大。

数据公司Paysa数据显示,美国公司平均每年给1万名人工智能方面的人才发放的工资约为6.5亿美元,其中亚马逊花费超过2亿美元招揽人工智能人才,居各大公司之首。巨大的人才缺口将人工智能行业顶级人才的薪酬推到令人咋舌的地步。人工智能领域,人才是最核心的竞争力。

猜你喜欢
刘庆峰语音人工智能
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
2019:人工智能
对方正在输入……
人工智能与就业
“科大讯飞”刘庆峰:创造千亿市值的AI语音拓荒者
“科大讯飞”刘庆峰:创造千亿市值的AI语音拓荒者
科大讯飞刘庆峰:用人工智能改变世界
刘庆峰,心里放着一张科大的书桌