人工系统中数据-因素-算力-算法作用及相互关系研究

2022-08-19 01:32崔铁军李莎莎
智能系统学报 2022年4期
关键词:算力子系统人工

崔铁军,李莎莎

(1.辽宁工程技术大学 安全科学与工程学院,辽宁 葫芦岛 125105;2.辽宁工程技术大学 工商管理学院,辽宁葫芦岛 125105)

目前人工智能的研究正在迅速展开,也产生了众多的研究成果。笔者也将人工智能理论引入系统安全与故障演化过程的分析。在研究中,提出了系统故障演化过程[1],描述系统故障过程;提出了空间故障网络描述系统故障演化过程[2-4],及相应的概念、数学模型和方法。空间故障网络理论可作为系统故障演化过程的智能分析方法。进一步的提出了系统运动空间和系统映射论[5],来研究人工系统和自然系统之间的数据流和因素流。人工系统是自然人发起建立的系统;自然系统是在自然状态下形成的系统。在研究过程中发现,除故障数据外,影响系统故障的因素起到了决定作用。这些因素由故障数据分析得来,而分析过程建立的算法则围绕这些因素和数据展开;同时由于算法的不同导致结果在相同算力下的时间成本差距很大。因此在研究空间故障网络理论过程中,数据、因素、算法和算力是相互制约的。而目前人工智能的3 大要素是数据、算法和算力,这与实际情况有所差异,因素作用在人工智能形成过程中的作用可能被严重低估。

关于因素在人工智能领域的作用研究并不多见。这些研究包括:人工智能企业颠覆性创新影响因素及其作用路径研究[6],因素驱动的东方思维人工智能理论研究[7],复杂环锻件生产动态扰动因素的智能管控技术[8],人工智能在银行业中对人的影响因素研究[9],基于结构方程模型的智能制造影响因素研究[10],不确定性因素下智能车路径规划研究[11],人工智能企业创新能力影响因素分析[12],集成人工智能和机器人的关键因素研究[13],基于因素空间的人工智能样本选择策略研究[14],智能挖掘机设计中的人机因素分析[15],机器学习和人工智能未来发展的因素研究[16],空间故障树与因素空间融合的智能可靠性分析[17],智能处理的基元-因素空间模型研究[18],机制主义人工智能理论的数学基础研究[19],智能制造发展影响因素研究[20]等。这些研究多数是分析具体问题中各种因素的作用,而未分析数据、因素、算法和算力作用,及其相互影响。这导致了因素在形成具有人工智能特征的人工系统过程中的作用难以被确认,进一步造成了将数据、算法和算力作为人工智能核心的既定事实。但由于缺乏对因素作用的认知,导致人工智能理论和方法目前只能围绕大数据分析展开,而难以寻找问题内在的联系和规则,导致人工智能的机械性,最终造成人工系统缺乏人的思维。

为研究因素在形成人工系统过程中的作用,研究数据、因素、算法和算力作用及相互关系,作者根据对系统故障演化过程的智能分析方法研究过程,论述了因素在形成空间故障网络(人工系统)过程中的作用。以建立人工系统为视角讨论了具有广泛意义的数据、因素、算法和算力关系。认为因素在形成具有人工智能特征的人工系统过程中是必不可少的。

1 人工系统的内涵

任何事物的存在都表现为系统形式,即存在即是系统。系统中各部分具有相关性,有能量、物质和信息的交换,不相关的事物即使在一起也无法组成系统。但现实世界中很难说一个事物和另一个事物无关,因为在一个系统中事物之间总是存在联系的,虽然形式可能不同,这是系统的相关性。系统由众多事物构成,又因为事物本身即为系统,因此一个系统也是由众多子系统构成的,这说明系统具有层次性。不同层次的系统结构、事物和关系可能都不相同,即使相同层次的子系统之间也是不同的。系统存在的根本原因是可完成预定的功能,即系统的目的性。正因为有目的,不同的事件由于外部作用组成系统完成目的。进一步的在目的性基础上,系统内部各子系统和事物分工合作,系统外部统一实现功能,即为系统的整体性。由于系统内部的物质信息变化,如保持系统的功能不变,则必须改变系统内部结构和组成部分,即为系统的动态性。对应的,系统外部条件因素的变化也会作用于系统,导致系统功能改变,影响系统目的。因此系统必须具有环境适应性以抵抗环境条件的变化。因此可以总结目的性是系统存在的意义;整体性是系统存在的条件;相关性和层次性是系统内部机制;动态性和适应环境性是系统结构变化的动力。

从系统存在的目的性讨论,可将系统分为人工系统和自然系统。人工系统是自然人制造的,在规定条件下能完成预定功能的系统。人工系统从规划、设计、实施和运行都是由人完成的,例如高铁、飞机、手机等等,当然也包括关系系统、社会系统等。对应的,自然系统是根据自然规律,自然运行的系统。表象上难以了解这类系统的目的性,但他们是组成自然界的基本单元,例如岩体系统、大气系统等。

论文主要关注人工系统的构建过程。人工系统是人类社会存在的标志。由人创造的任何具有目的性的事物都是人工系统。当然人工系统也随着人类的进步而进步。目前人工系统普遍可以分为人、机、环、管4 个子系统。人是人工系统的核心,是系统的建造者、使用者和受益者;机子系统是实现功能的工具;环子系统是人机工作的环境;管子系统主要规范人的行为。

进一步的,随着智能科学理论和大数据技术发展,人工系统进入了具有人工智能特征的阶段,即人工智能系统。目前以人工智能为代表的系统改变了原有人工系统结构。人的地位也发生了变化,从人工系统的中心管控地位逐渐边缘化。当然人仍是人工系统的设计和受益者,但不再参与一般的生产活动;而只关注于异常情况的应急处理。机子系统成为人工智能系统的核心,包括硬件设备和软件部分。进一步的,将其细化为机子系统和智能子系统,前者负责实际工作,后者提供决策支持。环境子系统进一步弱化,因为不再需要考虑人对环境的敏感性,只需考虑环境对机子系统的作用;而机子系统通常对环境影响不敏感。管子系统可能消失,因为作为受约束主体的人子系统消失。因此,当代具有人工智能特征的人工系统至少应包括智能子系统和机子系统。再细化研究,机子系统负责实际工作,而如何工作,如何决策都由智能子系统控制。机子系统是完成预定功能的硬件设备,本身不属于智能科学范畴,因此当今和未来的人工系统的核心是智能子系统。人工智能系统的智能是模拟人对自然系统的响应,构建完善的响应机制就是实现人工智能的本质要求。

实现以人工智能为核心的人工系统,需要明确4 个要素及其关系,即数据、因素、算力和算法。数据是目前人工智能的基础,由于人工智能的目的是代替人了解和控制自然系统,而自然系统存在的唯一标志是发散具有变化特征的数据[5],因此了解自然系统必然通过数据。算力是人工系统处理数据的运算能力,是解决问题的必要条件。算法是对人思维的抽象,是人对自然系统规律的理解。因素是自然系统变化的控制要素,是数据的标定,也是算法的基础。

图1 给出了数据、算力、算法和因素的关系。笔者认为建立以人工智能为特征的人工系统,必须明确数据、算力、算法和因素的作用和关系,四者相辅相成缺一不可。人工系统的内涵是丰富的,后文在不引起歧义的情况下,将具有人工智能特征的人工系统中智能子系统称为人工系统。因为人工系统建立的核心是智能子系统。

图1 数据、算力、算法和因素的关系Fig.1 Relationship among data,computing power,algorithm and factors

2 数据的作用

数据是建立人工系统的核心。至少在目前以人工智能和大数据为代表的人工系统中处于核心地位。如图1 中部,自然系统在因素变化的作用下散发出变化数据。但这些数据规模庞大,由于人的感知和处理手段限制只能得到可以感知、度量和处理的那部分数据。这部分可用数据可能只是原数据集的一小部分。

上节提出,人工系统是代替自然人了解和控制自然系统的系统,因此人工系统必须了解自然系统的特征,这些特征都来源于数据。但可用数据不能完全提供自然系统特征,因此即使后期的算力和算法非常先进也会由于数据的缺失导致分析错误。如果人工系统不能充分了解和控制自然系统,将导致人工系统难以完成自然系统功能或只能完成部分功能。

图1 上部展示了人工系统模拟自然系统的过程。人工系统模拟自然系统首先从分析数据开始。数据的实质作用是确定自然系统的关系和因素。即通过数据变化来确定构成自然系统的因素和因素之间的关系。作者提出的空间故障网络[2-4]就是一种分析系统故障演化过程的智能方法。其目的在于了解系统故障过程,将故障过程抽象为网络结构。问题在于如何确定因素和因素之间的联系,及因素之间的逻辑关系。通过数据识别因素的方法是将因素的变化与数据的变化耦合,确定因素变化和数据变化是否有对应关系,且这些变化是否符合已有现象和规律。将因素按照一定规律变化,数据随之按照一定规律变化,期间其它因素不变,即可辨识该因素。当确定了所有已知因素后,则需进一步确定因素关系,即因素的相关性。确定所有因素的全集或子集或单一因素,与其它子集或单一因素的关系。通过因素变化导致数据变化的一致性确定,如果一致说明这些因素具有相关性。进一步的,可通过因素分析法[21-22]和系统功能结构分析法[23]来确定因素间的逻辑关系,这里不做论述。

可以说按照目前人工智能的现状,建立人工系统过程中,完备的数据是保障人工系统成功的关键。但相对于数据更为重要的是因素,数据的目的是识别因素。

3 因素的作用

因素和数据具有纠缠性。笔者针对人工系统与自然系统的因素流与数据流提出了系统运动空间与系统映射论[5]。前者用于测量系统的运动,后者用于分析因素流和数据流的关系。认为系统运动的动力来源于因素改变,而系统发生运动的表象是系统散发数据的改变;数据变化是人能感知系统存在的条件,当然前提是数据可被感知。

因素流和数据流是两个重要概念,数据流从自然系统出发提供数据给人工系统;人工系统分析数据确定因素,进一步选择可控因素对自然系统进行调控。这是自然系统与人工系统的物质、能量和信息的交换方式。如果数据流提供的数据能全部被人工系统感知、识别和解释,最终得到影响自然系统的全部因素,且人工系统能调控这些因素,那么人工系统将完全可以模拟自然系统。这种情况是理想状态难以达到,除了数据不能完全感之外,可控制的因素也少于全部因素。首先即使能全部识别数据得到全部影响因素,那么目前的水平也难以有效控制这些因素作用于自然系统。由于数据感知和识别的问题,人工系统能分析的数据是数据流的一小部分,这导致能识别的因素也只有很小一部分,能控制的因素更少。因此人工系统无法实现自然系统的功能,或实现少部分功能。

图1 上部过程展示了通过数据确定因素和关系,因素和关系可建立规则,由这些规则组成自然系统。从上述可知基础数据缺失导致因素辨识缺失,进一步导致关系识别困难,最终造成规则缺失。得到的规则可能只是自然系统规则的一小部分,且是近似规则,不能完全等效。这就是现在以人工智能为代表的人工系统难以代替人了解自然系统的本质原因。

因素对数据的影响是确定性的,优化的因素可以使数据清晰,去掉冗余和错误,且能降低数据维度。本质上将因素作为空间坐标轴,而数据是空间中的点,如果坐标轴正确,数据点的定位就是确定的。可以想象,因素和数据的对应关系是一个复杂的结构。自然系统是因素通过某一结构转化为数据的过程形式;而人工系统是数据通过另一结构转化为因素的过程形式,后者是人工智能和大数据分析的工作。这两个结构并不一样,因为它们的输入和输出是相反的,是映射关系且映射方向相反。这即是系统映射轮的基本思想。

4 算力的作用

如果人工智能系统作为核心的人工系统构建成功,那么另一个问题就是如何运行,其核心内容即为算力。人与人工智能比较,人的思维能力明显占优,至少目前是。那么人工系统代替人的主要原因在于两方面,一是工作不适合人,由机子系统代替;二是人的纯计算能力很低,由智能子系统代替。

目前大体上算力的发展有两个方向,一是资源集中化的算力;二是资源分散的算力。前者以云计算为代表,建立大型云计算中心,集中计算力量,将纯计算对各行业进行业务分析。通过云平台的建立,服务方更专业,运行成本减少,计算效率提高;客户则主要关注业务流程,通过租用云平台实现对数据的分析和业务决策,减少了硬件维护和软件开发成本。后者以边缘计算为代表,与物联网共同发展。边缘计算主要利用数量庞大的终端智能设备,且这些设备多种多样,可及时完成算力有限的任务。由于云计算资源集中,传输和使用受到限制,而边缘计算更为灵活但算力有限,因此两者的结合将是必然的。

实际上也有很多影响算力的因素。比如规模,因为保持算力的核心是硬件系统,硬件系统的规模往往是限制算力的关键,比如云计算和边缘计算就是硬件规模导致的应用场景差异。算力成本也是影响算力的因素,云计算的使用和维护成本明显高于边缘计算的终端智能设备。因此在水电充沛的贵州省,很多科技企业建立了云计算中心。成本是算力发挥作用的保证。算力方式是算力提高的有效途径,例如信号的一位两状态表示方式和一位四状态表示方式,其算力将指数倍增长。前者是传统的电信号状态,后者是量子信号状态,差别很大。平台是限制算力的因素,例如云计算和边缘智能设备的算力差别是显而易见的。

最终,算力是保障人工系统实现的基础,是机子系统,是工具。算力的提高往往依靠科技进步和大型科技企业的发展。但算力的发展与人工系统模拟自然系统的能力并不等同。人工系统的目的是完全模拟自然系统变化和反应,进而模拟和代替自然人的思维和工作。从图1 上部可知,在人工系统模拟自然系统的过程中,首先数据分析是需要最强算力的;由数据确定因素和关系虽需要算力但也需要智能的因素分析算法;而其后的建立规则和组成自然系统的过程更多的是思维层面的算法。因此,在上述过程中,算力的作用逐渐减小。因此单纯依靠目前人工智能构建的人工系统难以进行高级的规则建立和自然系统构造,而只能是低层次的数据分析、因素辨识和关系确定。

5 算法的作用

与算力对应,算法的发展较为简单限制更少。人工智能目前主要有3 大流派:1)结构模拟流派,认为人工智能可通过构建与人脑结构相似的结构,通过输出和输入的对应关系实现学习固化结构来模拟人的思维,例如神经网络[24-26];2)功能模拟流派认为人工智能源于人脑逻辑,进而抽象为数学逻辑,将人的认知和思维以符号为基本单元进行表示,认知和思维过程等同于众多单元符号的运算过程,例如物理符号系统[27-30];3)行为模拟流派,认为人类行为是有机体对外界环境变化进行的自主响应行为,并通过身体行为表现出来,可通过外界环境变化预测主体响应行为,从而达到人工智能的目的,例如感知行为系统[31,32]。虽然这些人工智能的流派思想和具体实现方法不同,但它们都是基于一定思维的方法流程,将这些流程通过数学模型展示出来即形成算法。

与算力相区别,算法的发展多以个人为单位出现。算法是思想的形式化,思想源于个人,而且将思想转化为算法不受算力那种对规模、成本、方式和平台的限制。因此具有革命和创新的算法往往来源于个人,也是目前人工智能研究最为广泛的领域。

算法是提高数据使用效率的关键,而算法的核心即为表达式和参数的设计。对于人工系统和自然系统而言,自然系统可作为表达式的因变量;表达式中的参数是因素的具体值;而表达式本身就是人工系统模拟自然系统的结构,即上文提到的系统映射。因此算法的优劣一方面影响着算力的发挥,也同时受到因素和数据的影响。从图1 上部可知,在人工系统模仿自然系统的过程中,源于思维的算法作用越来越强,同时算力作用逐渐减弱,因为算法更能体现人的高级思维。

6 数据-因素-算力-算法的相互关系

如上论述了数据、因素、算力和算法之间存在的联系和相关性,它们有如图1 所示的形式和作用关系。进一步的将人工系统和自然系统作为对象,对上述4 方面关系进行梳理,可形成图2。

图2 人工系统和自然系统与数据、因素、算力和算法的关系Fig.2 Relationship between artificial system and natural system and data,factors,computing power and algorithm

算法和算力是对人工系统而言的,算力代表了人工系统形成数据流到因素流之间映射关系f(x)的计算能力,主要取决于人工系统的硬件设置和物理特征;算法代表了人工系统形成映射关系f(x)的方法论,目前仍主要来源于人的思维创新活动,是人工系统形成真正意义上人工智能的关键领域。算法和算力共同构成了人工系统形成映射f(x)的基本能力,算力是基础,可通过巨量的枚举寻找适当的映射f(x);算法则是在算力基础上对计算过程的优化,压缩计算过程的时间和空间复杂性,进而等效为算力提高。由于算力受到硬件和物理性质限制,目前想通过基础方法提升算力较为困难,一般采用集成和叠加形式提高算力。而更有效的方式是设计优秀的算法来等效地提高算力,是人的创新思维活动,在面对复杂系统性问题时算法的作用优于算力。

因素和数据是人工系统通过算法和算力形成映射f(x)的基础。数据流是人工系统从自然系统接收到的各种数据的集合,人工系统的重要任务是将这些数据分类,分类的结果就形成了因素。如果数据变化形成的数据流通过映射f(x)得到稳定的因素分类形成因素流,则该映射关系f(x)是成功的。因素和数据之间对于人工系统存在着明显关系,该关系是实现人工系统功能等效于自然系统功能的关键。

自然系统按照自然法则运行,人工系统模仿自然系统的首要任务就是确定这种法则。对于人工系统,自然系统的数据流是基础,人工系统通过因素流控制自然系统,期间形成的映射f(x)就是描述自然法则的核心。具体的f(x)就是我们通过大量实验得到的自然科学中各门类学科的各种公式,及描述系统的各类逻辑表达式,这些公式和表达式是对自然系统在不同侧面的描述。人工系统需要形成映射f(x),再通过映射f(x)来模仿自然系统。如果将映射y=f(x)比作函数,则f是该函数的结构,如加减乘除、积分微分、数理逻辑等;各种变量x代表了各种因素;x在自然系统运行过程中的具体值的一系列变化成为数据流;y代表了人工系统对自然系统在特定方面的模仿,是人工系统存在的目的。

式(1)是简单的线性映射函数,其中“+”代表了该映射的结构,x代表了因素,y代表了目标值。因此式(1)代表了人工系统模仿自然系统在y方面的规律,人工系统接收到x因素的数据,通过算法得到线性函数结构,以算力得到系数a和b。所以各科学中的公式都是通过上述过程基于人工系统对自然系统的抽象,以使人工系统能模仿自然系统。面对更复杂情况,进一步发展了结构模拟、功能模拟、行为模拟的人工智能3 大流派,但实质上与式(1)的映射关系确定无异,只是采取的算法不同,也是由于算力在这些方面的效果不明显导致的。

综上,目前和今后以人工智能为代表的人工系统在模拟自然系统的过程中,应同时考虑数据、因素、算力和算法的相互作用。大体上,数据和因素是强作用关系,构成了因素流和数据流,前者从人工系统流向自然系统,后者从自然系统流向人工系统,相互耦合建立了系统映射关系;算力和算法是强作用关系,算力主要在人工系统模拟自然系统的开始阶段发挥主要作用,算法则在后期起到主要作用。当然我们的目的是建立具有人工智能特征的人工系统从而模拟自然系统。更具体的可将该过程等效为函数映射,人工系统结构可具体化为函数解析式。算法体现了函数解析式的分析方式,因素则是函数中的变量,数据是函数中的因变量和自变量数值,算力是求解该函数的能力。可见实现具有人工智能能力的人工系统必须同时考虑数据、因素、算力和算法,及其相互作用。

7 结束语

论文主要研究了构造具有人工智能特征的人工系统过程中,数据、因素、算法和算力的关系,主要结论如下:

1)论述了人工系统的内涵。人工系统是区别于自然系统的,由人设计、建造、运行和维护的系统。人工系统是代替自然人了解和控制自然系统的系统。构建人工系统的关键是确定数据、因素、算法和算力的作用及其之间关系。

2)论述了数据、因素、算法和算力的作用,并证明了它们之间具有相互联系和不可取少的性质。数据是自然系统散发出来的,是人工系统辨识因素的基础,也是形成算法的基础;因素是人工系统控制自然系统的方式,也是算法所需的变量;算法是体现因素与数据关系,描述人工系统结构的方式;算力是解算算法的保障,同时需考虑数据和因素的特征。

3)论述了数据、因素、算法和算力的相互关系。算力是人工系统形成映射关系的计算能力;算法是形成映射关系的方法论;数据是人工系统从自然系统接收到的各种数据的集合;因素是这些数据分类的结果。各科学的公式都是人工系统对自然系统的抽象,该抽象是通过数据、因素、算法和算力的相互关系实现的,最终形成映射实现人工系统对自然系统在特定方面的模仿。

猜你喜欢
算力子系统人工
算力盗用:一种新型财产侵害*
不对中转子系统耦合动力学特性研究
中科曙光:联合发布全国首个“一体化算力交易调度平台”
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
人工3D脊髓能帮助瘫痪者重新行走?
算力网络场景需求及算网融合调度机制探讨
人工,天然,合成
人工“美颜”
GSM-R基站子系统同步方案研究
关键信号设备检修自动盯控子系统研究