迁移学习研究综述

2017-12-15 23:10王惠
电脑知识与技术 2017年32期
关键词:迁移学习负迁移

王惠

摘要:迁移学习作为机器学习领域的一个新的研究方向近年来受到越来越多的关注和研究。传统的机器学习方法要求源领域数据和目标领域数据同分布,而迁移学习放松了这一限制要求,能够把已经获得的知识应用到不同但相似的领域中,解决了目标领域中可用训练样本不足的学习问题。该文对迁移学习的相关研究进展进行了综述,从方法、技术、应用三个方面介绍了在该领域所做的研究工作,并指出了迁移学习未来可能的研究方向。

关键词:迁移学习;同分布;跨领域;负迁移

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)32-0203-03

随着计算机技术的快速发展,机器学习在理论研究和实践应用两个方面都取得了巨大进步。为了保证训练得到的分类模型具有可信的分类效果,传统的机器学习方法通常假设数据的生成机制不随环境改变 [1],即要求源域数据和目标域数据具有相同的分布。然而在机器学习的实际应用领域中,如自然语言处理、大数据分析、生物信息技术、自动控制等,这一假设通常因为过于严格而不能成立。迁移学习(Transfer Learning,TL)的出现打破了这一限制要求,只要源领域和目标领域之间具有一定的关联关系,在目标领域分类模型训练时就可以借助从源领域数据和特征中已经提取的知识,实现已学习知识在相似或相关领域间的复用和迁移,使传统的从零开始学习变成可积累学习,不仅降低了模型训练的成本,而且可以显著提高机器学习的效果。因此迁移学习可以帮助人们处理一些新的应用场景,使机器学习在没有充足可用标签数据和规模化应用时也能够实现。

近年来,迁移学习作为一种新的学习框架受到越来越多学者的关注和研究。美国国防部DARPA机器人大赛文档系列给出了迁移学习的基本定义:利用事先学习的知识和技能来识别新任务的学习能力。迁移学习广泛存在于人类的认知学习活动中,比如一个人如果会使用C++编程,那么他很容易就会掌握Java编程语言;一个人要是会拉小提琴,那么他就能够轻松地把拉小提琴的相关音乐知识迁移到学习钢琴中去。而且在迁移学習的两个领域之间,可以共享的信息越多、相似度越高,知识迁移学习的效果就越好,反之,效果越差,甚至会给目标领域数据的学习带来不好的影响,即产生“负迁移”现象。

1 迁移学习方法研究进展

根据迁移学习过程中从源领域迁移到目标领域的具体内容划分,通常可以把迁移学习方法划分为四种,即:实例迁移学习方法、特征迁移学习方法、参数迁移学习方法和关系迁移学习方法。

1.1 实例迁移学习方法

实例迁移法(Instance-transfer)的主要思想是根据某个相似度匹配原则从源域数据集中挑选出和目标域数据相似度比较高的实例,并把这些实例迁移到目标域中帮助目标域模型的学习,从而解决目标域中有标签样本不足或无标签样本的学习问题。该迁移学习方法通过度量源域有标签的样本和目标域样本的相似度来重新分配源域中数据样本在目标域学习过程中的训练权重,相似度大的源域数据样本认为和目标域数据关联性比较强对目标域数据学习有利被提高权重,否则权重则被降低。上海交通大学的戴文渊[2]等人提出一种基于boosting提升技术的实例迁移学习方法TrAdaBoost。该方法把迁移学习思想应用到Adaboost算法中,利用boosting技术在算法迭代过程中通过自动权重调整机制逐渐过滤源域数据集中与目标域数据差异性较大的样本。权重调整之后,这些带权重的源域数据将会作为辅助的训练数据,与目标域数据一起训练从而来提高目标域数据的学习效果。吴蕾[3]等提出迁移稀疏分层概率自组织图(Transfer Sparse Hierarchical Probabilistic Self-OrganizingGraph,TSHiPSOG)方法。该方法首先在源域和目标域中分别提取多层次、多颗粒度的表示向量,并且采用最大信息系数(MaximalInformation Coefficient,MIC)来度量源域和目标域表示向量的相似性程度,在两者之间建立关联,然后再利用源域中的部分表示向量帮助目标域的分类器的学习。同时,该方法在算法迭代过程中加入稀疏项约束,不仅可以防止模型在单领域数据上出现过拟合现象,而且可以有效提取利用源域知识,辅助提升目标域学习的准确性。吕静[4]把bagging集成方法和聚类算法相结合实现样本的迁移。首先对分别用不同的聚类算法对相同的学习数据进行聚类,然后对每一个聚类结果进行加权投票。通过bagging集成技术对源域数据进行过滤,根据投票结果将那些与目标域数据聚类在一起的源域数据留下,剔除那些未与目标数据聚在一起的源域数据。由于聚类实现的是同类中的数据紧凑,而不同类之间具有较大的差异性,从而通过聚类可以挑选出和目标域相似度高的数据。最后利用这些与目标域数据相似度高的数据来帮助目标域的学习。

1.2 特征迁移学习方法

特征迁移法(Feature-representation-transfer)主要是在源域和目标域之间寻找典型特征代表来进一步弱化两个域之间的差异从而实现知识的跨领域迁移和复用。该迁移方法根据是否在原有特征中进行选择进一步的又可分为特征选择迁移学习方法和特征映射迁移学习方法。特征选择迁移学习方法是直接在源域和目标域中选择共有特征,把这些特征作为两个领域之间知识迁移的桥梁。Dai[5]等人提出一种基于特征和类别标签联合聚类的预测跨领域文档的分类方法COCC。该算法首先识别出领域内与领域外文档共同的部分,即领域间共享的词特征;然后把已学习的知识和类别标签信息通过这些共享的词特征从源域迁移到目标域。COCC方法通过对领域特征和类别标签进行同步联合聚类实现了知识的跨领域迁移。特征映射迁移学习方法不是直接在领域的原有特征空间中进行选择,而是首先通过特征映射把各个领域的数据从原始高维特征空间映射到低维特征空间,使得源域数据与目标域数据之间的差异性在该低维空间下缩小。然后再利用在低维空间表示的有标签源域数据训练分类器,并对目标域数据进行预测。张博[6]等把典型相关性分析应用到跨领域迁移学习中。该算法首先分别求出源域和目标域的桥接特征和特有特征,然后利用典型相关性挖掘它们之间的共享知识,通过选择合适的基向量组合训练分类器,使降维后的相关特征在领域间具有相似的特性,从而有利于把源域已获的知识迁移到目标域中。宋鹏[7]等把基于特征映射的迁移学习方法应用到跨库语音情感识别应用中。该方法首先分别提取源语音情感库和目标语音情感库中的情感特征,然后通过特征降维算法寻找到邻近的低维特征空间,使用最大均值差异嵌入(MMDE)算法计算领域之间的相似度,并进一步通过SDA方法进行特征降维来提高类别区分度,把源语音情感库中的标签信息迁移到目标语音情感库的无标签学习模型的训练过程中,最后训练得到较好的情感分类器。endprint

1.3 参数迁移学习方法

在参数迁移法(Parameter-transfer)中,源域数据和目标域数据可以通过某些函数表示,而这些函数之间存在某些共同的参数。参数迁移法就是寻找源域数据和目标域数据之间可以共享的参数信息从而可以把已获得的参数知识迁移。程旸[8]等提出一种基于知识迁移的极大熵聚类算法。该方法首先使用极大熵聚类算法求出源域的聚类中心,然后选用聚类中心作为迁移知识,并使用知识迁移隶属度表示目标域和源域聚类中心的匹配度,最后将匹配后的源域知识迁移到目标域中利用。该方法在纹理图像上的分割实验表明不仅能够提高算法的聚类精度,改进图像的分割效果,而且还能适应不同迁移场景的需求,增强了算法应用的鲁棒性。

1.4 关系迁移学习方法

关系迁移法(Relational-knowledge-transfer)假定源域数据之间的关系和目标域数据之间的关系存在一定的相关性,通过建立源域数据的关系模型与目标域数据的关系模型的映射模型来实现关系知识的迁移。在文献[9]中提出了一种基于二阶马尔科夫逻辑形式的关系迁移学习方法。该方法以马尔可夫逻辑谓词变量公式的形式发现源域的结构规律,然后实例化目标域的谓词变量公式。通过这种方法,可以成功地把已经学到的知识在分子生物学、社交网络领域之间迁移。

2 迁移学习相关技术研究

迁移学习的技术研究主要围绕三个方面:迁移什么、何时迁移和如何迁移。迁移什么是研究在机器学习的过程中哪些知识可以迁移到其他领域中帮助新领域的数据学习,实现跨领域的知识迁移;何时迁移则关注迁移的时机,即在学习的过程中什么时候把已掌握知识迁移到目标域的学习中;如何迁移就是在找到了迁移知识之后针对具体应用问题所采用的迁移学习方法。目前的迁移学习技术涉及多種机器学习技术,如:半监督学习、领域适配、鲁棒学习、样本选择偏置、多任务学习等。通过迁移学习的研究,不仅可以更加充分的利用现有已标签数据信息,而且可以模型的泛化能力和鲁棒性,实现知识在新领域新应用模型中的迁移复用。

3 迁移学习的应用

目前迁移学习的典型应用领域包括文本分类、目标识别、情感分类、自然语言处理、协同过滤、人工智能规划等。

在文本分类领域已有大量的迁移学习研究应用工作。孟佳娜[10]提出了一种基于图排序的知识迁移学习方法。该方法首先使用源域和目标域的文本构建一个融合的图模型,采用了基于向量空间的方法计算文本关联度。然后以搜索谷歌搜索引擎所采用的PageRank算法的打分机制在文本之间相互打分表示它们的相似程度,最后确定目标域中未标注文本的分值,从而预测其类别标签。谭建平[11]等提出了基于半监督的SVM迁移学习算法(Semi-supervised TLSVM)来对文本进行分类。该方法使用基于SVM的半监督学习方法和局部全局一致性方法(LLGC)构建分类模型,并采用交互迭代的方法来对目标方程求解,最终得到面向目标领域的分类器。该方法在文本分类中的实验表明比传统的分类器拥有更高的精确度,充分利用了源域有标签样本的信息,解决了新领域有标签样本不足的问题。

在目标识别方面,刘振[12]等人提出了一种基于多重相似性的多源域迁移学习方法。该方法把迁移学习推广到多源域,认为每个源域都或多或少有一些知识可以迁移,从而提高发现与目标域相似源域可能性以避免“负迁移”的发生。在衡量目标域与多个源域的相关性时从“域-域”和“样本-域”两个维度,较全面地表征了目标域与源域之间的联系。然后根据流形平滑性假设原则,认为目标域分类器与相关源域分类器对目标域无标签样本具有相似标签值,提出多源域迁移流形正则项,实现源域知识向目标域迁移的目的。在图像目标识别的实验结果表明所提出的迁移学习方法不仅能够从多个不同源域中挖掘更多的知识用于目标域学习,而且能够根据域间相似性有选择地进行迁移。

马凤闸[13]把迁移学习方法应用到中文评论情感分类中,提出了基于语义的特征迁移情感分类方法。该方法使用源域特征与目标域特征之间的语义相似度和语义相关度两个维度共同来衡量两者之间的关联程度,然后将源域的特征项的情感类别标签信息迁移到目标域。首先把源域文本和目标文本映射到类别向量空间模型中,计算两者之间的语义相似度和语义相关度,并根据语义相关度进行排序,将类别隶属度与语义相似度进行加权平均;然后应用样本分类置信度和样本权重的双重选择策略从源域中挑选出与目标域数据关联性高的数据辅助目标域训练分类器,使得目标域的分类结果更加准确。

4 迁移学习的未来展望

迁移学习作为一个新兴的研究领域,解决的是如何利用已学到的知识帮助目标领域的学习,目前的研究主要集中在算法方面,在应用方面的推广还需要进一步的展开和深入。针对迁移学习的特点和目前的研究现状,未来可能的研究方向可能有:

第一,领域之间相似性的度量方法研究。因为迁移学习的效果在很大程度上取决于领域之间的相似程度。因此进一步的研究准确的领域之间的度量方法是迁移学习工作中的一项重要工作。

第二,从多源域迁移知识。一个领域的知识毕竟是有限的,可以尝试把多个相关领域的知识帮助集中起来目标领域的学习,即把多源学习和迁移学习结合起来,这样可以增加寻找到和对目标域学习更加有利知识的机会,从而提高迁移学习的学习效率与效果,使得迁移学习变的更加安全与稳定,有效避免负迁移的发生。

第三,迁移学习应用的适用性。目前的迁移学习研究工作应用范围相对较窄主要集中在网页分类方面,在其他方面的应用算法还有待进一步的研究,如:人工智能规划、强化学习、自动控制等,从而不断提高迁移学习应用的适用性。

斯坦福大学的著名教授吴恩达曾在2016年NIPS会议上说过:“迁移学习将会继监督学习之后的下一个机器学习商业成功的驱动力。”随着研究的不断深入,迁移学习将会在更多的领域得到应用和推广。endprint

猜你喜欢
迁移学习负迁移
从认知角度探讨大学英语网络教学模式
奇异值分解与移移学习在电机故障诊断中的应用
汉语负迁移对英语写作的影响及启示
法语第二外语教学中英语的迁移作用分析
试析韩语汉字词对以汉语为母语的学习者学习韩语过程中的语言迁移现象
大数据环境下基于迁移学习的人体检测性能提升方法