忆阻器类脑神经突触的研究进展

2022-02-17 13:36陈心满钟智坚岳志秀高芳亮史艳丽

华南师范大学学报（自然科学版） 2022年6期

陈心满, 钟智坚, 岳志秀 , 朱俊, 高芳亮, 史艳丽, 章勇

(1. 华南师范大学半导体科学与技术学院，佛山 528225； 2. 中山火炬职业技术学院，中山 528436； 3. 华南农业大学图书馆，广州 510642)

随着智能时代对大规模数据处理要求不断提高，基于Von Neumann架构的计算机正面临着严峻的挑战。例如，Google Brain团队利用上万个通用处理器建立了人工神经网络并应用于面部识别、国际象棋等场景；基于深度学习算法的AlphaGo机器人需要在上千个通用处理器和数百个图形处理器的帮助下才能玩一局围棋，耗费巨大。无人驾驶、深度学习和智能机器人等智能技术是人类科学技术发展的重要方向，但基于传统通用处理器的实现方案无疑会增加成本并限制性能。因此，构建新一代低成本、高效率、低功耗的人工神经网络是智能技术的重要步骤。人脑中存在约1 000亿个神经元，神经元通过神经突触连接共同构成复杂但高效、低功耗的神经网络，维持人的正常生命活动。像人脑一样能够对信息进行学习、记忆和灵活处理的智能计算机是未来计算机发展的方向和目标。神经形态网络就是一种受人脑启发提出的类脑计算系统。由于生物体神经突触是完成大脑神经元信息传递和协调的基本单元，也是生物神经网络进行学习、记忆、感知等复杂生命活动的重要基础结构，其中突触可塑性(Synaptic plasticity)是神经细胞学习、记忆功能的前提[1-4]。因此，基于电子器件实现类脑突触功能是构造大规模人工神经形态网络首先需要解决的问题。

电子类脑神经突触，主要是依据器件导电状态在物理信号刺激下的变化来模拟突触权重的改变。利用CMOS、晶体管、电阻、电容等传统基本元件，配合数模转换、模数转换等复杂电路系统模拟突触功能亦有报道[5-7]，但除了功能器件，往往需要复杂的电路系统和其他元件的配合，导致系统复杂，功耗高，与超低功耗的生物神经网络系统相悖。忆阻器是一种新型电子器件，被认为是继电阻、电容、电感后的第四种电子元件，相关理论由蔡少棠于1971年首次提出[8]，并于2008年由惠普公司首次成功制备[9]。由于忆阻器具有可高密度集成、低功耗且高速开关等优点，可以与传统的CMOS工艺兼容，已被广泛应用于数据存储、逻辑运算等领域。同时因为忆阻器具有精确可调的电导，被认为是模拟神经突触的最佳选择。本文在比较忆阻器和神经突触相似性的基础上，就近些年基于忆阻器在类脑神经突触应用方面的研究进展进行简要综述。

1 忆阻器和生物神经突触的相似性

忆阻器是具有“三明治”结构的两端器件，跟生物突触的“突触前膜-突触间隙-突触后膜”相似(图1)。忆阻器具有非易失性，有“记忆”功能，其电阻或电导的变化取决于施加于器件的信号，即忆阻器的阻态与施加于器件的电激励历史有关，这与生物神经突触的特征高度相似[1-2]。从忆阻器阻变特性的机理来看，其阻态变化主要基于介质内部离子(如氧空位、活性金属离子等)在外部电激励的作用下产生迁移所导致。这种离子迁移过程与生物神经突触信号传输过程中的K+、Ca2+等离子迁移类似。表1比较了忆阻器和生物突触在结构、性质等方面的差异。另外，忆阻器简单的器件结构、纳米级的介质层以及忆阻器与CMOS工艺的兼容性，使得构建类脑大规模集成电路成为可能。目前，忆阻器是构建电子神经突触的最佳方案[1-3]。

图1 忆阻器与生物神经突触的比较[2]Figure 1 The comparison diagram of memristor and biological nerve synapse[2]

表1 忆阻器与生物神经突触的比较Table 1 The comparison diagram of memristor and biological nerve synapse

2 基于忆阻器类脑突触可塑性的模拟

突触可塑性(Synaptic Plasticity)是神经突触的基本属性，是指在神经刺激信号作用下，突触的形态和功能发生一定的改变，且可以维持一段时间的特性。这是大脑神经系统实现学习、记忆和维持其他生命功能的重要基础。突触的可塑性可以通过“突触权重”(Synaptic Weight)进行衡量，以反映神经元之间的连接强度[4]。因此，神经突触具有可塑性，是指突触权重根据突触前后神经元的活动发生改变。

根据神经刺激信号作用下突触权重的变化，突触可塑性表现为多种形式。权重变化的时间长和短分别对应于生物系统中的长时记忆和短时记忆，因此可塑性主要可分为长时程可塑性(Long-Term Plasticity,LTP)和短时程可塑性(Short-Term Plasticity,STP)。以上2种可塑性都具有兴奋(Potentiation)和抑制(Depression)可塑性类型，分别对应于长时程增强(Long-Term Potentiation,LTP)和长时程抑制(Long-Term Depression,LTD)、双脉冲易化 (Paired-Pulse Facilitation,PPF)和双脉冲抑制(Paired-Pulse Depression,PPD)。神经刺激信号多为脉冲形式，根据突触前后神经信号脉冲到达时间及脉冲速率产生的可塑性，分别称为放电时间依赖可塑性 (Spiking-Timing-Dependent Plasticity,STDP)和放电速率依赖可塑性 (Spiking-Rate-Dependent Plasticity,SRDP)等。当然，除了基本的可塑性功能，神经突触也具有高级学习功能，如：非联想学习 (Nonassociative Learning)、联想学习(Associative Learning)。大脑正是通过结构复杂的神经元和突触神经网络系统，调节神经突触可塑性以适应外界刺激，从而控制生命活动。

2.1 STP的模拟

神经突触STP指短暂性的突触权重变化，对神经系统的瞬时记忆和短时程适应具有重要作用。STP的形式多样，现有的文献中主要研究PPF和PPD这2个重要的学习规则，对应突触权重的增强和抑制[10-12]。

在PPF规则中，当第二个电压脉冲紧跟在前一个脉冲之后，第二个脉冲将引起突触权重的增加。MILANO等[12]基于ZnO纳米线忆阻器，观察了纳米线表面Ag导电细丝在电压脉冲作用下的形成/溶解转变过程，并实现了神经突触的STP功能。如图2A所示，通过施加幅度2.5 V、脉冲宽度2 ms、脉冲间距2 ms的电压信号，器件的响应电流逐渐提高，相应的电导也逐渐增加。通过对电导的归一化处理发现：器件的电导权重随电压脉冲的作用逐渐上升，这与PPF过程中的权重变化类似。PPF产生的权重会受脉冲间隔的影响，脉冲间隔越大，权重越小(图2B)。类似的PPF功能在其他忆阻器上也得以实现，如IZO忆阻器[13]、有机金属卤化物钙钛矿忆阻器[14]、Ag/Ag2S/SiO2/ITO忆阻器[15]。

图2 ZnO忆阻器突触的PPF功能[19]Figure 2 The PPF function of ZnO memristor synapse[19]

PPD规则与PPF相反，当第二个电压脉冲紧跟在前一个脉冲之后，第二个脉冲引起的突触电流减小，即2次脉冲刺激后器件的权重减小。许多文献已对忆阻器模拟PPD规则进行了报道[16-18]。JOSEPH等[19]基于两端生物分子忆阻器提出PPF和PPD规则的模拟方法，发现通过增大电压脉冲的间隔，可以使响应电流的变化趋势由随脉冲数目逐渐上升转变为逐渐下降，分别对应神经突触的PPF和PPD过程，成功模拟PPF向PPD的转换。

2.2 LTP的模拟

神经突触LTP由持续的、强度较大的刺激引起，造成长期性的突触权重变化，可以保持几个小时甚至更久[20]。LTP的持续时间比STP时间长，但也会随时间衰减。LTP主要有2种形式，其中在神经刺激作用下突触权重逐渐增加的称为“长时程增强(LTP)”，相反，突触权重逐渐减小的称为“长时程抑制(LTD)”，两者往往会成对出现。利用忆阻器的非易失特性，可以对LTP规则进行模拟[21-25]。ILYAS等[25]制备的Ag/SiOx∶Ag/TiOx/p++-Si忆阻器具有典型的双极型阻变性质(Bipolar Resistive Switching)，并且分别用幅度为+1.2 V和-1.2 V的电压脉冲信号模拟神经突触的兴奋信号和抑制信号，成功模拟了LTP和LTD过程(图3)。

图3 Ag/SiOx:Ag/TiOx/p++-Si忆阻器模拟长程可塑性功能[25]Figure 3 Ag/SiOx:Ag/TiOx/p++-Si memristor simulates long-range plasticity function[25]

2.3 STP向LTP的转化

通过充分的训练可以使STP向LTP转换，这是记忆和学习的基本过程[26-27]。采用忆阻器模拟人工神经突触可塑性的过程中，可以通过改变脉冲刺激数目[25,28]、脉冲时间参数[29]等实现STP向LTP的转换。LI等[30]研究表明，在Au@Ag纳米粒子忆阻器上施加的脉冲数在10～30范围时(图4)，归一化的权重电流在去除刺激后迅速下降，与记忆保持率相对应的突触权重下降至近零。但当脉冲数增加到50时，突触权重下降到大约30%的相对稳定状态，并且没有进一步衰减至初始状态。通过增加脉冲刺激数目，可实现STP向LTP的转换。YI等[29]基于ZnO光子忆阻器，通过减小电压脉冲的间隔使STP转换为LTP。

图4 Au@Ag纳米粒子阻器模拟神经突触STP到LTP转换过程[30]Figure 4 Au@Ag nanoparticle arrestor simulates the process of STP to LTP conversion of synapses[30]

2.4 SRDP的模拟

SRDP是生物神经突触的一项重要功能[2]，反映了突触权重对神经刺激频率的依赖。通常,随着脉冲刺激频率的上升，突触的权重会相应增加。已有较多基于忆阻器实现类脑神经突触SRDP功能的报道，如MAPbI3钙钛矿忆阻器件[31]、CMOS/忆阻器混合器件[32]、硫族化物忆阻器[33]、Ag/AgInSbTe/Ag相变忆阻器[34]。XIAO等[31]实验发现，施加电压脉冲刺激MAPbI3钙钛矿忆阻器，脉冲间隔较长时，即脉冲频率较低，器件的电导经过短暂上升后很快恢复到初始状态，提高脉冲刺激的频率可以提高器件的电导权重(图5)。该研究结果表明：忆阻器的记忆特性可通过刺激信号频率来调控，从而实现STP、LTP的变换。

图5 忆阻器模拟神经突触SRDP的过程[31]Figure 5 Memristor simulates the process of synaptic SRDP[31]

2.5 STDP的模拟

STDP是大脑神经突触的一种高级学习功能，遵从Hebbian学习规则[35-38]：当突触前膜的刺激先于突触后膜刺激时，突触的权重会增加；相反，当突触后膜刺激先于突触前膜刺激，突触的权重会减弱。假定Δt为突触后膜和突触前膜刺激的时间差，Δω为突触权重的变化，则STDP规则可以描述为：

(1)

其中，ω0代表权重，τ代表权重的变化速率。

在忆阻器模拟STDP的研究中，器件两端脉冲代表神经突触前后神经元传递的神经刺激，器件两端的电压为VM=Vpre-Vpost，脉冲序列施加在器件两端的时间差Δt=tpre-tpost，器件的电导权重变化依赖于Δt[25,39-42]。

图6A、B提供了2种模拟STDP的脉冲序列[25]。EPSC/IPSC[Excitatory Postsynaptic Current(EPSC)、Inhibitory Postsynaptic Current(IPSC)]变化代表脉冲序列施加后器件电导权重变化的归一化数值。Δt>0时，若VM大于LTP的阈值Vth1，器件获得有效的刺激，Δω>0且随着|Δt|的增加而增加，出现LTP性质；相反，当Δt<0时，若VM小于LTP的阈值Vth2，Δω<0并且随着|Δt|的增加而减小，出现LTD性质。图6C、D是利用外电路构建神经网络系统的STDP形式，在Δt>0和Δt<0时，突触权重根据时间差的大小表现出3种不同的变化。当然，生物体不同部位或不同刺激下的STDP规则有所差异。

图6 Ni/0.7Pb(Mg1/3Nb2/3)O3-0.3PbTiO3/Ni忆阻器模拟及简化后神经突触STDP过程[25]Figure 6 Ni/0.7Pb(Mg1/3Nb2/3)O3-0.3PbTiO3/Ni memristor simulates and the process of synaptic STDP[25]

根据神经回路中信息获取和处理的方式不同，STDP可以分为以下4种[43-46]：

(1)反对称型Hebbian 学习规则(Antisymmetric Hebbian learning rule)STDP，即Δt>0时突触权重增加,Δt<0时突触权重减少；

(2)反对称反 Hebbian 学习规则(Antisymmetric anti-Hebbian learning rule) STDP，即Δt>0时突触权重减少；Δt<0时突触权重增加；

(3)对称型 Hebbian 学习规则 (Symmetric Hebbian learning rule) STDP，这种规则不依赖于Δt的正负，只跟|Δt|大小有关；

(4)对称反 Hebbian 学习规则 (Symmetric anti-Hebbian learning rule) STDP，无论Δt大小、极性如何，突触权重都为抑制状态。

KUZUM等[46]基于Ge2Sb2Te5相变型忆阻器(PCM)通过施加不同的脉冲序列实现了STDP的4种规则，如图7所示。

图7 Ge2Sb2Te5相变型忆阻器模拟神经突触4种STDP功能[46]Figure 7 Ge2Sb2Te5 phase change memristor simulates four STDP functions of synapse[46]

2.6 再可塑性的模拟

再可塑性(Metaplasticity)指神经突触可塑性能力受其活动历史调节的现象，是突触可塑性的高级形式，也称为“突触可塑性的可塑性”[47-48]。一般来说，前期刺激或经历会影响突触可塑性(如STP的阈值)，且对后续的突触可塑性的性质产生影响，从而对突触可塑性进行再塑造。研究表明:通过改变前期的刺激，LTP、LTD的可塑性效果会相应地改变，这种调节作用可以维持至少2 h[49-51]。此外，再可塑性对生物个体学习记忆的调节起重要作用。例如：一定程度增加神经细胞的兴奋性，有利于学习能力的提高[52-57]。

如图8A所示，再可塑性的研究要求在获得可塑性行为之后引入前期刺激，并观察前期刺激对可塑性的性质影响(图8A)。TAN等[56]利用具有遗忘特性的Pt/WO3-x/Pt忆阻器模拟了突触再可塑性的功能(图8B)，脉冲刺激(1.7 V，10 μs)作为前期刺激不会引起电导变化，但施加前期刺激之后使当前刺激(2.1 V，10 μs)触发更大的电导增加，体现了前期刺激对当前可塑性的影响。LEE等[57]利用Pt/KNbO3/TiN忆阻器实现了LTP、LTD和STDP功能，通过改变脉冲序列参数，影响氧空位导电细丝的状态，从而对之后的LTP、LTD、STDP的可塑性进行调节，可以实现对突触可塑性的可塑性研究，即再可塑性。

图8 生物神经突触再可塑性示意图及忆阻器模拟神经突触再可塑性过程[56]Figure 8 The memristor mimics synaptic metaplasticity[56]

最近，本课题组[58]在Ag/HfOx/ITO忆阻器上发现了一种特殊的阻态依赖阈值开关(Stateful Threshold Switching)。忆阻器分别处于双极性阻变的ON、OFF态时，在毫伏级的工作电压区间，依然具有阈值开关特性 (TSON和TSOFF)，且开关窗口依赖于ON、OFF态的电阻。这种特殊的电致阻变特性，可以简化类脑学习-遗忘过程中再可塑性的实现过程(图9)：通过施加3个0.2 mV的增强脉冲进行学习，遗忘过程为0.01 mV响应电流的衰减，在ON和OFF状态下的学习遗忘过程通过VReset或VSet脉冲作为前期刺激来调制。

图9 忆阻器阻态依赖阈值开关特性模拟神经突触学习-遗忘行为的突触再可塑性[58]Figure 9 The metaplasticity of learning-forgetting based on “stateful” threshold switching of memristor[58]

2.7 忆阻器突触在感知神经系统中的应用

生物体在形成触觉、视觉、味觉等过程中，需要外部感知器、神经链路、神经中枢等共同作用，其中少不了神经突触的参与。忆阻器突触在构建仿生感知系统中可以起到非常重要的作用，可以使仿生系统更接近生物体性能。

最近，集成忆阻器和压阻传感器或其他类皮肤传感器所构建人工触觉神经系统备受关注[59-63]，这对模拟皮肤的触觉、痛觉等具有重要意义。

动物感知触觉的过程(图10)：由触觉感受器感知触觉，再经过神经回路传到大脑进行信息处理，该过程的信息传递离不开神经突触的作用。ZHANG等[59]首次集成压阻传感器和忆阻器并组成了人工触觉神经系统。压阻传感器和忆阻器制备简单的结构及成分组成，其中忆阻器作为神经突触传递触觉信号，可稳定模拟神经突触的PPF、PPD、STDP等基本功能，提高了人工触觉系统手写识别过程的精确度。GE等[61]利用柔性忆阻器构成触觉感知回路，对柔性电子皮肤的研究具有较大参考意义。YOON等[63]利用扩散型忆阻器构建了人工伤害感受器，经过忆阻器处理后的热信号逐渐衰减至正常状态，模拟了受损组织(伤害感受器)的自愈过程(图11)。总之，利用忆阻器构建人工神经突触，再将其运用于人工神经系统中，有利于搭建贴近生物体特性的仿生系统。

图10 触觉感知系统及其模拟过程[60]Figure 10 The tactile sensing system and its simulation process[60]

图11 忆阻器模拟伤害感受器[63]Figure 11 The memristor mimics nociceptor[63]

2.8 非联想学习的模拟

非联想学习(Nonassociative learning)反映动物面对单一刺激引起的适应过程，是人和动物具备的简单的学习能力，是其他复杂学习行为的基础，主要包括习惯化(Habituation)和敏感化(Sensitization)两种类型[64-67]。习惯化是指当不产生伤害的刺激持续施加到个体上时，个体逐渐对这种刺激的自发反应减弱或消失的现象。习惯化会随着时间而消退或被新的刺激所取代，该过程即去习惯化(Dishabituation)。

YANG等[61]制备了HfOx忆阻器和NMOSFET集成的突触器件，模拟了突触的习惯化和非习惯化过程，如图12所示。首先对器件施加100个脉冲，幅度为-1 V，作为习惯化脉冲；之后施加幅度为0.45 V的脉冲，作为去习惯化脉冲(图12A)。随着刺激的增加，器件的响应电流在习惯化脉冲的作用下逐渐衰减，对应于神经突触的长时程抑制(LTD)过程，表明器件在连续的脉冲作用下逐渐适应了这种弱刺激，减小了对习惯化脉冲的注意力；在去习惯化脉冲作用下器件的响应电流逐渐上升，代表新刺激的出现导致此前建立的习惯化现象被取代，模拟了去习惯化过程。器件模拟的习惯化和去习惯化过程与生物实验中的非联想学习过程对应(图12B[64])。除了电脉冲，ZHAO等[68]基于ZnO纳米线光敏忆阻器，利用UV光脉冲引起的非联想学习过程，可以很好地模拟习惯化、敏感化过程：无UV光照射时器件响应电流逐渐衰减，对应于习惯化过程；UV光照射是器件响应电流逐渐增加，对应于敏感化过程。

图12 忆阻器模拟神经突触非联想学习功能Figure 12 The memristor simulates non associative learning of synapse

2.9 联想学习的模拟

联想学习普遍存在于人和动物的神经系统中，是个体在复杂环境中生存的重要保障，具体指环境刺激与生物体自身反应之间形成联系的过程，最早由PAVLOV提出。在经典的联想学习实验中，PAVLOV在给予狗食物的同时用铃声刺激狗，经过一段时间的训练，狗在听到铃声时就会分泌唾液，说明狗将食物和铃声建立了联系。在这个实验中，食物作为非条件刺激，任何情况都会使狗分泌唾液；铃声为条件刺激，在联想学习训练前不会引起狗分泌唾液，经过训练后变成了条件刺激，可以在一定的时间内刺激狗分泌唾液，说明联想学习成功建立。

目前报道的忆阻器联想学习方案多采用忆阻器配合运算放大器、电阻等元件进行模拟，或通过仿真软件建立复杂的电路系统实现。YURIY等[69]通过微处理器和数-模转换电路，在实现忆阻器功能的基础上，模拟了联想学习的各项基本性能。MARTIN等[70]通过一个忆阻器配合加法器、比较器电路构建了基本的二输入联想学习系统，通过忆阻器的非易失特性实现了联想学习功能。BICHLER等[71]通过具有记忆特性的场效应晶体管配合同步时钟信号，实现了联想学习功能。WAN等[72]提出了一种氧化铟锌基晶体管配合反相器的方案，可模拟联想学习的部分功能。通常，联想学习的过程包括新信息的学习、旧信息的消退、再恢复、泛化以及抑制性保护等基本过程。然而以往报道仅仅能够模拟联想学习的某部分功能，很少能够实现联想学习的整个过程。本课题组[58]利用Ag/HfOx/ITO忆阻器特殊的阻态依赖阈值开关(图9)，分别采用±0.4 mV和±0.75 V脉冲为非条件刺激和条件刺激信号，并设定阈值电流1 μA。研究表明：狗对铃声产生反应，并将食物和铃声建立了联系。模拟巴普洛夫狗联想学习建立过程模拟见图13A，其消退、再恢复、泛化以及抑制性保护见图13B。同时，由于器件特殊的阻变特性，联想学习的全过程均可实现无极性操作。值得一提的是，Ag/HfOx/ITO突触器件的功耗仅为5.71 pW,与生物突触(约10 pW)相当，但远低于此前报道的电子突触，因此这对仿生人工神经网络具有重要意义。

图13 Ag/HfOx/ITO忆阻器模拟联想学习过程及消退、再恢复、泛化以及抑制性保护[58]Figure 13 Ag/HfOx/ITO memristor simulates associative learning process,extinction,recovery,generalization and inhibitory protection[58]

人的视觉是通过视网膜接收外界图像，再通过神经回路传至大脑处理而形成的。对类脑智能而言，构建人工视觉神经网络同样具有重要意义。具有光电响应的忆阻器，利用器件的光电响应和非易失特性，可以模拟视觉神经对图像信息的传感及存储。ZHONG等[74]利用受UV光控的聚(2-乙烯基萘)有机薄膜忆阻器模拟神经突触的STP功能，利用UV光实现了对PPF和PPD功能的调控。HU等[75]报道了基于ZnO1-x/AlOy异质结的光电忆阻器，所制备的器件对UV光具有较好的响应特性和易失性阻变性质，施加UV光可以使忆阻器突触的兴奋性突触后电流(Excitatory Postsynaptic Current,EPSC)逐渐上升，通过提高UV光的开关频率或光功率可以实现从STP到LTP的转换(图14)。视觉信号的获取、传输、处理是构建人工神经网络的重要一环，利用光电忆阻器构建神经突触，模拟图像的处理过程[76-78]是一种系统简单、功耗低和操作简易的方法。ZHOU等[79]利用光电忆阻器模拟了STP、LTP功能，同时利用忆阻器阵列应用到人工视网膜的图像处理过程中，提高人工视觉神经网络对图像识别准确性(图15)。

图14 光电忆阻器光刺激频率和功率模拟STP到LTP的转换[75]Figure 14 The Photoelectric memristor simulates STP to LTP conversion[75]

图15 光电忆阻器阵列的人工视网膜[79]Figure 15 The photoelectric memristor arrays for artificial retina[79]

除了探究UV光对光电神经突触的权重影响，LI等[80]利用ZnO/PbS异质结器件在全光谱范围内光电突触的活动，其中短波长的红外光可模拟突触的抑制可塑性，长波长的UV光可诱导突触兴奋可塑性。同时还模拟了神经突触的其他性能(如LTP、STP和SRDP等)，该器件对光响应的波长范围大，适用于多种环境中光电神经突触的模拟。文献[81]报道了一种对红外光和可见光有响应的钙钛矿光电忆阻器，将该光电忆阻器用于光电神经突触的模拟，采用红外光作为忆阻器神经突触的兴奋刺激，采用红光作为抑制刺激，分别使光电神经突触的权重逐渐增加或减少。

3 基于忆阻器的人工神经网络

在利用单一忆阻器模拟实现单个神经突触的功能模拟之后，研究人员把研究重点放在如何构建高密度的人工神经网络工作中。忆阻器结构简单、体积微小，为构建大规模神经网络奠定基础。如图16所示，忆阻器神经交叉阵列中每个交叉点的忆阻器都代表一个连接前后神经元的突触结构，其中突触的权重可以用忆阻器的电导来表示。通过规模化集成的忆阻器神经网络已实现了稀疏编码[82]、模式识别[83-84]、特征提取[85-86]、数据聚类[87]等研究。

稀疏编码算法是一种无监督学习方法，SHERIDAN等[82]利用32×32交叉忆阻器阵列在硬件上实现稀疏编码算法，该算法可以提取图像中的学习特征值进而提取隐藏特征，以较少的神经元重建图像输出，从而实现自然图像的稀疏编码(图16)。PARK等[88]通过硬件，实现了基于忆阻器的神经网络HNN( Hardware Neural Network)，并用于脑电波(EEG)信号的识别。研究人员首先采集人在想象出和说出不同元音字母(a、i、u)时产生的不同EEG信号，接着在FPGA等设备的协助下，忆阻器HNN神经网络对EEG信号进行处理，实现语音信号的识别(图17)。此外，研究人员还利用忆阻器神经网络实现了对图像[89-90]、文字[91-92]等信息的识别和分类。

图16 忆阻器神经交叉阵列及用于稀疏编码[82]Figure 16 The memristor neural cross arrays towards sparse coding[82]

图17 EEG模式识别忆阻器系统[88]Figure 17 The EEG pattern recognition memristor system[88]

4 总结与展望

忆阻器以其独特的记忆电学性质，称为模拟神经突触的最佳选择。本文首先总结了不同忆阻器模拟神经突触的可塑性，包括短时程可塑性(STP)和长时程可塑性(LTP)及STP到LTP的转换过程、SRDP、STDP，并着重介绍了可塑性的“可塑性”性质(即再可塑性)的模拟，并概述了忆阻器神经突触的高级应用，如非联想学习、联想学习以及忆阻器突触在感知神经系统中的应用；其次总结了忆阻器模拟神经突触性能的研究情况；最后研究了忆阻器神经交叉网络在稀疏编码、模式识别等方面的应用。忆阻器可以很好地模拟神经突触的各项功能，能和CMOS器件、电子线路、嵌入式系统等组成具有神经形态的电路系统，未来在神经形态计算、图像处理、类脑人工智能等方面存在很大的发展空间。尽管如此，忆阻器模拟神经突触、构建类脑神经系统仍存在一些问题需要解决，可概括为以下几个方面：

(1)忆阻器制备技术受限，影响器件的稳定性和均一性，使大规模器件的集成应用受限制。基于忆阻器神经突触的神经网络要求器件阵列具有良好的性能，以提高系统的稳定性，但大部分对于忆阻器性能的研究重点集中在单个器件上，对于忆阻器大规模交叉阵列的稳定性、均一性的关注较少[93-94]。目前忆阻器的工作机理还不够清楚，给忆阻器神经突触性能增加了更多不确定性。另外，器件组成的神经网络系统中，漏电流影响集成阵列中器件的性能，使器件之间产生串扰，限制了大规模集成阵列的应用。目前，解决忆阻器集成阵列中漏电流的方法主要是运用1T1M(One-transistor-one-memristor)结构代替单一忆阻器，或者运用忆阻器和CMOS电路进行集成，这在一定程度上可以解决串扰问题，但会限制系统的集成密度。

(2)忆阻器或忆阻器交叉系统工作功率相对较大，不利于低功耗类脑神经网络的模拟。生物神经系统中单个突触的工作能耗约为10 pW，这种超低功耗是神经系统高效工作的保障。通过文献调研发现，忆阻器神经突触虽然可以模拟生物突触的基本功能，但功耗远大于生物突触，这是限制忆阻器神经网络发展的重要因素。因此制备具有超低工作电压或电流的忆阻器突触器件，进而构建超低功耗忆阻器神经网络，是一项重要的研究方向。

总之，将忆阻器运用到神经突触模拟进而构建大规模神经网络中，还有巨大的开发空间，随着忆阻器制备技术的提高和阻变机理研究的深入，忆阻器在仿生系统和类脑神经网络中所起的作用会越来愈大。