智慧系统研发方法探索

2020-11-28 16:59周中元
中国军转民 2020年8期
关键词:智能化智能信息化

那么,什么是智慧 什么是智能 这看似不言而喻,厘清这两个概念对研发智能系统还是有益的。

人的思维能力加上记忆的知识称为“智慧”,人有了智慧就可以产生智人的行为和语言,智人的行为和语言的能力就是“智能”。

智能具有以下四种能力:一是感知能力,能夠感知外部世界、获取外部信息,这是产生智能活动的前提条件和必要条件;二是记忆和思维能力,能够存储感知的信息和思维推理所产生的知识,同时能够利用已有的知识对信息进行分析、判断;三是学习和自适应能力,通过与环境的相互作用,不断学习积累知识,使自己能够适应环境变化;四是行为决策能力,对外界的刺激作出反应,形成决策并传达相应的信息。具备这四种能力的系统就是智能系统或智能化系统。

一、智能化系统的特点

在这一轮智能化系统建设过程中,与以往的信息化系统建设有两个非常显著的不同:创造性工作和数据决策。

创造性工作是智能化建设非常显著的特点。以往的信息化系统建设,实际上是将手工的管理活动升级成计算机辅助的管理活动,信息化系统建设就是借助计算机这一强有力的工具,更高质量、高效率地完成手工的管理活动。因此,在信息化系统建设过程中,所遵循的是手工管理的程序、规范和要求,也就是“需求牵引”,最多是根据计算机的特点,对手工管理流程作少量的改进,鲜有创造性的管理活动被发现。而智能化系统建设所研发的应用很多是以往想做而无法做的,甚至是根本就没有想到可以这样做的。比如说时下为了追踪新冠疫情传播过程,各地研发了基于手机移动轨迹和交通数据的“绿码”APP,允许没有涉足中高风险区域(包括乘坐公共交通工具)的人员拥有绿码可以正常出行。这一应用是人工管理时代和信息化时代都无法实现的,是一项创造性的管理活动。如果没有手机轨迹大数据和交通大数据的支持,这样的应用显然无法实现。

大数据时代,数据参与决策已经是司空见惯的事了。这方面的例子在互联网销售行业比比皆是,即使在政府治理方面,这样的事例也很多。比如,有A、B两个小区要规划建设养老院和幼儿园,以往是由城市规划设计部门根据经验规划设计养老院和幼儿园的数量和地点。现在,设计部门可以商请公安的户籍管理部门提供每个地区的常住和暂住人口的年龄段人数统计数据。如果22~35岁的育龄青年较多,可以据此多设幼儿园,如果70~80所的老年人数据较多,则建议多建养老院。这样的设计显然更加精准。

二、智能化系统的基石

信息化系统的基石我们非常熟悉,就是计算机基础设施和应用软件两大基石。到了智能化系统,所依赖的基石更多,每个基石所起的作用与信息化时代有所不同。智能化系统有四大基石:数据、算力、模型和应用场景。

需要指出的是,智能化系统是建立在信息化系统基础之上的,因此,信息系统的基础设施被认为是已经具备的。

数据是智能系统最显性的特征。2000年以来,得益于互联网、物联网、传感器、移动设备的快速发展,全球生产和存储的数据量剧增。2019年,时任工信部副部长陈肇雄说:“我国海量数据快速增长,数据量年均增速超过50%,预计到2020年,数据总量全球占比将达到20%,成为数据量最大、数据类型最丰富的国家之一。”据2018年底IDC预测,全球数据总量到2025年将达到175ZB,金融服务、制造、医疗保健以及媒体娱乐等行业是数据增长的主要推动力。

算力就是计算能力。海量的数据需要巨大的存储容量和强大的运算能力,这一次,没有依靠巨型计算机,因为这太昂贵不易普及,而是借助廉价的PC服务器构成的集群。这样的处理方法,除了有Hadoop、Spark这样的并行计算框架使大规模并行计算编程变得比较容易外,还得益于AI芯片的出现。这一轮的智能化系统,核心是以深度学习为主的智能应用。深度学习在训练阶段需要大数据和强大算力的支持,训练过程主要是通过随机梯度下降方法在大量训练数据的配合下让人工神经网络不断拟合,其中的计算绝大部分是超大规模矩阵乘法和加法运算,这类运算虽然量大,但计算逻辑简单,关联关系少。AI芯片简化了传统CPU的控制逻辑,去掉了高速缓存(cache),大量增加了运算单元,从而大幅提升了矩阵运算的速度。AI芯片主要分为GPU、FPGA、ASIC,GPU擅长大规模并行计算,FPGA可根据深度学习算法灵活编制芯片功能,ASIC更可以为深度学习量身定制,因此更适合深度学习模型。

智能系统常用的算法模型分成浅层学习、强化学习、深度学习三大类。浅层学习算法即使在深度学习盛行的今天,仍然有一席之地,主要有:1984年提出的决策树算法、1995年提出的支持向量机(SVM)、1997年提出的AdaBoost和2001年提出的随机森林。强化学习的发端是上世纪60年代的井字棋游戏,大火于2016年的AlphaGo,由此引发了全世界范围的人工智能大热。

深度学习起源于2006年,由于在图像识别和语音识别方面的非凡成就而举世瞩目。以深度学习为主的智能系统的模型是深度人工神经网络。深度神经网络具有更多的层数,每层具有更多的神经元数,因此整个模型规模宏大,模型中所含的参数数量惊人。以获得2014年ImageNet挑战赛分类第二、定位任务第一的VGGNet为例,网络包含了16~19层深的卷积神经网络(具体层数由配置设定),使用的参数数量多达140M左右。由此不难想象,训练模型,为这些数量惊人的参数各自选定合适的值是多么不容易的一件事,这也是深度神经网络训练需要用到海量训练数据的原因。

在四个基石中,应用场景最不起眼,却是最为关键和困难的。设计应用场景困难,是因为,一方面智能化应用是信息化时代没有做过的事,是一项创造性的工作,尤其是在当下智能化建设的起步阶段,缺少成功的智能化应用可以借鉴学习,需要技术人员和应用场景领域专家共同讨论设计;另一方面,今天的人工智能,还不是通用型的,是在垂直领域专用的,设计者必须对领域知识有深入的了解。

应用场景对成功研制智能系统非常关键,可以说是四个基石中的“牛鼻子”。在应用场景确定后,才能根据应用需要准备大数据、设计模型、配备算力。特别是收集大数据,根据应用场景去收集,才能做到有目的,而不是盲目地收集大量尚不知用途的数据。

应该看到,在这一轮智能化系统开发大潮中,有相当多的智能APP并没有达到理想的商业目的,“理想很丰满,现实很骨感”,每个人的手机中都装了很多智能APP,不可否认,有相当一部分很少使用,甚至从未使用。这里有技术有待进一步发展成熟原因,有商业模式不匹配原因,有期望值过高的原因,有投资过热造成商业泡沫的原因,更有应用场景是否是人们真实需求的原因。

三、大数据分析适合做什么

先来看看几个典型的大数据分析案例。

案例1,2008年年初,谷歌根据网民输入的搜索词汇,推出了“谷歌流感趋势”,近乎实时地对全球当前的流感疫情进行预测。

案例2,BIDMC与哈佛医学院合作研发的人工智能系统,对乳腺癌病理图片癌细胞的识别准确率能达到92%。

案例3,最高人民法院“法眼”平台利用系统资源使用大数据和系统受到非法访问和攻击大数据进行系统运行效率和安全态势估计。

通过这3个案例可以看出,大数据分析比较适合做状态监测评估、数据分类和趋势预测三类任务。

今天的社会环境中,部署了大量各种各样的传感器,可以实时采集环境中的各类状态数据,再加上大部分设备具有智能接口,能够及时报告设备自己的状态数据。通过对这些状态大数据的实时采集、分析研判,可以轻松实现对环境状态的及时、精准监测评估。

数据分类是大数据分析的最核心的应用。如,从电商对客户的购买习惯、年龄、喜好、地域等分析,实现客户精细的分类管理,完成对客户精准的产品推荐;再如,现在已经非常普及的人脸识别,其实也是一种数据分类,分类的结果是符合或不符合。

根据历史数据,预测下一时期(可能几分钟,也可能几个月、几年)的发展趋势是大数据分析的又一个擅长能力。预测股票市场走势、预测体育赛事胜负、预测交通流量、预测疫情发展趋势、预测环境变化趋势……利用历史数据,借助大数据分析模型,几乎可以对所有事情完成预测,其结果比人类传统做法要准确、及时得多。

四、ToB智能系统的用户和核心应用

ToB智能系统有别于以各式各样的智能APP为主的ToC智能系统,智能政务系统、智能企业系统、智能军事系统都是ToB智能系统。ToB智能系统的用户似乎是显而易见的,那就是单位和客户。如果是这样的认识,是有重大疏漏的。ToB智能系統最关键的用户是单位首脑,单位首脑必须与单位业务部门区分开来,因此,ToB智能系统的用户是首脑、部门、客户三大类。

都知道ToB系统是“一把手”工程,必须由单位的一把手亲自抓才可能成功。一把手亲自抓不只是部署、指挥和支持,更重要的是一把手会提出系统的核心需求。换句话说,系统首先应该满足一把手的需求,按照一把手的总体目标和要求去实施。

认识到系统的关键用户是单位首脑后,就不难理解ToB智能系统的核心应用就是三类:发展、稳定和首脑的管理目标。

发展主要是围绕单位发展目标的,例如,政务系统要求系统能够最大程度地支持政府发展经济,如合理的城市规划、良好的营商环境、便捷的城市交通等。

稳定是希望通过技术手段,保障单位管理平稳,如政务系统要保障城市平安,防控群体事件,保证安全生产,预防公共卫生事件,确保绿色环境等。

首脑的管理目标是指首脑的任期目标以及体现首脑个人理念和特质的管理目标。这部分目标因人而异,是最能体现首脑个人特点的,也是ToB智能系统有别于ToC智能系统的鲜明特征。

五、智能化系统建设原则

由于信息化系统基本上是将手工工作进行计算机化,所以,信息化系统建设一直奉行“需求牵引”原则。但是,这一原则是不适应智能化系统建设的。这是因为,智能化应用通常是做以前人工没有做过的事,系统设计时,用户是无法提出明确的需求,也就不可能有“需求牵引”了。

那么,智能化系统建设的原则是什么呢

在启动研发工作之前,用户或研发者都会确定智能化应用能够实现哪些目标,或者说能够承担哪些任务。比如说,政府首脑要求,严防农村发生群体食物卫生安全事故发生。根据这一指示要求,有关部门研发了乡村宴席智能化管控系统,对乡村所有成规模的宴席进行管理。得益于万物互联,供应商、厨师、宴席场地,以及宴席所用的食物原料的产地、生产日期等数据可以及时录入系统,同时系统还对食物加工过程进行视频监控。系统对采集的数据与系统存储的大数据进行分析比对,试图找出潜在风险(比如伪劣产品、污染产品),对加工过程进行视频分析,自动管控卫生措施不规范行为(比如厨师穿着是否合规、现场卫生条件是否合格)。由此可见,智能化系统建设的原则“任务导向、数据驱动”。

六、智能化系统研发思路

为了避免出现“烟囱林立”,信息化系统建设强调“总体设计、统一开发、同步完成”的研发思路。可惜的是,这种强调一体化统一步骤的研发思路并不适合智能化系统建设。

从前面的讨论可以得出,智能化应用是在信息化系统基础之上研发的。而且,由于没有明确的需求,智能化应用只能由数据工程师和应用领域专家一起讨论,根据“任务导向、数据驱动”原则,一个一个设计开发出来。尤其是在当下的智能化系统研发初期,各个应用领域都缺乏成功的应用案例可以借鉴,智能化系统建设只能在信息系统基础上,一个个研发智能应用。因此,可以说,智能化系统是由信息化系统之上的一个个智能应用组成的系统。

根据以上讨论,智能化系统建设思路只能是“统一平台、柔性开发、各显神通、生长式建设”。统一平台是指统一信息系统平台,这与信息化建设要求是一致的;柔性开发是因为智能应用缺乏明确需求,只能采用类似“快速原型法”的开发方法,在研发、试用过程中逐步修改完善智能应用;各显神通是希望各个智能化应用由擅长应用领域的团队研发,这样可以让智能应用快速地“从想法到实现”,而不是信息化建设常用的一个团队包打天下;生长式建设是指智能化系统不可能像信息化系统那样一次建设完成,智能化应用只能成熟一个上线一个,而且,随着不断赋予系统新的任务和要求,以及智能应用更多潜力的发掘,智能化系统建设在相当一段时期,只能是分一期、二期建设,无法确定工程的终期。

七、“奶油蛋糕”模型

有了以上铺垫,现在可以给智能化系统形象地定义为“奶油蛋糕”模型。

在这个蛋糕模型中,那个完整的蛋糕体是信息化系统,多个漂亮的奶油裱花是一个个智能化应用。

蛋糕体是由面粉、糖、油脂、奶油和蛋按比例搅拌均匀后,放入烤箱一次性烘烤而成,这与信息化系统“总体设计、统一开发、同步完成”特点非常契合。

奶油蛋糕上面的一个个漂亮的裱花则是蛋糕师利用奶油、巧克力、水果等材料,一个个做出来后装裱在蛋糕体上。这就像智能化应用,一个个被生长式研发出来,并且被集成在信息化系统之上。

自从引入第一批智能化应用之后,信息化系统就赋予智慧能力,系统就成为智慧系统。现在的系统,如果没有智能化应用,是很难得到用户的青睐,因此是没有市场的。这就像奶油蛋糕一样,如果没有漂亮的奶油裱花点缀,蛋糕是很难卖出高价的。

另外一方面,如果只有奶油裱花,没有蛋糕体依附,就无法成为商品出售,而且也不能填饱肚子。智能化应用也是如此,如果没有信息化系统支撑,一个个离散的智能化应用不成体系,只能解决单个问题,很难做大市场,无法卖出应有的价格,研发团队将难以为继。

八、军事智能系统的应用与发展

军事领域历来是各个国家,尤其是发达国家高技术发展的优先领域,这一轮以大数据、深度学习为动力的人工智能技术尤其如此。以美军为首的西方发达国家,在人工智能辅助情报分析、态势研判、作战方案生成与评估、火力打击、后勤运输保障等方面投入了大量资金,相继取得了一批实用成果,有些已经投入了实战使用。有专家预测,到2025年,人工智能在军事领域的市场规模预计将达到近200亿美元。

下面用两个例子来看看美军是如何在实战中运用人工智能技术的。

先看今年年初发生的苏莱曼尼事件。2020年1月2日晚,伊朗革命卫队将军卡西姆·苏莱曼尼,从黎巴嫩乘坐空客民航6Q501航班秘密抵达巴格达,他要与伊拉克民兵武装“人民动员组织”(PMF)的副司令贾迈勒·贾法尔·易卜拉希米一起,指挥一场摧毁美军战略运输机的军事行动。

他们乘坐两辆越野车,现场指挥什叶派民兵对巴格达国际机场发动了火箭弹袭击。这次袭击并不成功,只导致十多名伊拉克政府军士兵伤亡,没有造成美军损失。但是,这两辆越野车频繁发出通讯信号,很快被美军定位,并确定这就是苏莱曼尼现场指挥中心。

美军将这一情报上报特朗普后,特朗普当即批准击杀苏莱曼尼。

当地时间1月3日凌晨,在巴格达机场附近,苏莱曼尼及其随行人员搭乘的两辆越野车被美军武装无人机激光制导的4枚“地狱火”导弹击中,苏莱曼尼、易卜拉希米等人被炸成碎片。

在这一事件中,美军首先借助AI系统,根据其强大的情报网(线人、信号情报、网络情报)获取的情报,迅速分析判别,确定苏莱曼尼于2020年1月3日1时左右抵达巴格达国际机场,并锁定了其乘坐的越野车。也许在他登机的那一刻,中情局的人员就盯上了他。根据这一重要情报,美军进一步侦查获取详尽的战场环境情报,生成击杀苏莱曼尼的作战方案。

因为事发地点位于伊拉克,属美军势力范围,所以可以直接从科威特基地(距事发地点530公里)派出无人机进行事前的侦查行动,配合卫星数据进行拟态环境构建,确认“战场约束空间”。

使用 AI 系统分析敌我、战场信息,根據预定时间制定具体的策略,包括出发时间、无人机型号、数量、分工、搭载弹量以及路径规划等等。

在请示特朗普总统得到批准以后,美军立即实施作战行动。

无人机于预定的时间到达指定地点,并锁定其乘坐汽车。通过AI 系统实时计算无人机导弹发射策略,包括发射时间、角度、导弹数量等,然后发射地狱火导弹,完成精准打击。

AI系统控制无人机再次勘察现场,如出现生命迹象则再次实施打击,确认目标死亡之后自动返航。

第二个例子是刚刚发生的事件。美东时间8月20日,在美国DARPA AlphaDogfight挑战赛的人机大战中,苍鹭系统公司(Heron Systems)的AI算法在与戴着AR眼镜的F16飞行教官Banger在VR F16模拟器中展开角逐,AI算法的碾压式攻击令Banger毫无招架之力,取得5:0的压倒性优势。这已经不是人工智能第一次击败人类战斗机飞行员了,早在2016年6月,美国辛辛那提大学开发的人工智能系统 Alpha AI,在模拟空战模拟器中完胜经验丰富的美国退役空军上校。据称,阿尔法在空中格斗中快速协调战术计划比人类快了250倍,从传感器搜集信息、分析处理到做出正确反应,整个过程不到1微秒,可同时躲避数十枚导弹并对多目标进行攻击,还能协调队友、观察学习敌人战术。

这两个事件证明,人工智能技术已经参与到了整个 OODA 循环(观察、调整、决策、行动)之中,并且在情报研判、目标识别与锁定、辅助决策和自主火力打击方面起了十分关键的作用。

另外,在军队信息化建设时代,美军主导了“网络中心战”,将情报、作战指挥、武器平台、后期保障等信息分系统用网络紧密连接,相互协同,帮助快速高效地完成作战行动。但是,在信息战手段丰富、反应迅速、破坏力超强的今天,战时要想有效保证这样的网络能正常运转,几乎是一项不可能完成的任务。

因此,只能退而求其次,“化整为零”,让更小的单位具有自主的情报研判和指挥决策能力。这就是目前十分热门的“分布式作战”。

更小的单位普遍存在情报研判能力不足、指挥决策不够灵活问题。这时候,人工智能就可以大显身手了。在当前的网络数字时代,陆、海、空、天、网等多维空间内每分每秒都产生着海量数据,可以比较容易地建立军事战略、战术情报大数据集。通过军事大数据训练的情报人工智能系统,可以从海量、多源和异构的情报数据中提取支撑决策的关键信息、识别目标意图和发展战略征候,帮助各基层单位指挥员极大地提高情报分析研判能力。同时,从海量信息中挖掘和提炼敌方意图、目标价值、战场局势及变化趋势等态势认知要素,辅助指挥员高效且准确地对战场态势做出判断。

深度学习中的对抗生成网络(GAN)还能辅助产生欺骗性极强的假情报。如将GAN运用到制造新的电子干扰机,该电子干扰机能够根据对手的雷达信号制造出令其雷达接收机根本无法识别的假信号,达到干扰功率最小、干扰效果最大的目的。

智能武器是军事人工智能的一个重要方向,直接为军事活动提供了更多的“智能”。一个典型的人工智能武器通常须具有自动目标检测与多传感器数据融合能力、智能抗干扰能力、智能协同杀伤能力。

在辅助指挥决策方面,可以基于指挥员的作战构想,快速生成方案和计划,精确模拟推演执行效果,自动生成优化建议,辅助指挥员快速制定高质量的决策。

作战或试验完成后,可以从积累的作战数据中挖掘和学习敌方行动规律及复杂战争规律,优化战法战术和指挥控制模型算法,辅助指挥员发现问题和优化策略。

总之,军事智能化,就是通过基于人工智能的军事复杂系统博弈理论研究、作战概念创新、虚拟作战仿真,探索不同战场环境下的制胜机理;加强网络化智能感知、战场态势认知、自适应任务规划与决策、作战力量协同、智能综合保障等模型算法的优化及关键技术攻关,构建起智能化主导的作战体系,以提升打赢智能化战争的能力。

(作者简介:周中元,1984年从南京大学数学系毕业进入28所工作,教授级高级工程师,主要从事综合电子信息系统研制,先后主持研制了大型军事电子信息系统十余项,是军事电子信息系统数据分析处理方面的技术领军人员,获得过原总装备部和国防科工委联合颁发的“高新武器装备发展建设工程银质荣誉奖章,国防科技进步奖一等奖2项,二等奖3项,三等奖1项,曾任中国电科集团公司第28所副所长、通信子集团副总经理、中国司法大数据研究院院长、国家空中交通管制工程技术中心主任等职务。近年来致力于大数据、人工智能领域的技术研究和工程实践,任中国司法大数据研究院大数据首席专家、成都市智慧城市特聘专家,著有《大数据挖掘技术与应用》、国军标《GJB5241概念建模语言IDEFIX的句法和语义》《GJB5242功能建模语言IDEF0的句法和语义》、国家电子行标《SJ21141.1~5军用软件C/C++编程要求》。)

猜你喜欢
智能化智能信息化
一种智能化移动学习系统的设计思考
月“睹”教育信息化
月“睹”教育信息化
月“睹”教育信息化
智能化仪器仪表的翻转课堂设计
基于Moodle平台的语文阅读教学“智能化模式”初探
“一核三轴”:信息化时代教学管理模式的探索
基于Moodle平台的语文阅读教学“智能化模式”初探
智能烹饪机
超智能插秧机