基于自然语言处理的人工智能歌词创作

2019-09-18 03:58李思特
中国科技纵横 2019年14期
关键词:自然语言处理应用

李思特

摘 要:自然语言处理是近几年发展迅速的智能算法,其具有的多种优势正被越来越多的人认可。本文围绕人工智能歌词创作的社会热点,从文本生成出发,宏观上认识了自然语言处理的定义、应用领域及技术原理,并且深入剖析了RNN和LSTM这两种文本生成算法的基本原理,具有一定的参考价值。

关键词:自然语言处理;应用;文本生成;RNN;LSTM

中图分类号:TP391.1 文献标识码:A 文章编号:1671-2064(2019)14-0041-02

0 引言

随着人工智能技术的高速发展,智能化已成为当今时代的发展特色,智能化应用也体现在生活中的方方面面,人机对话、人机对弈、AI写歌词等新闻热搜已为人们所熟知。其中,人工智能歌词创作频频成为互联网的热门话题,在2018年的综艺节目《中国好声音》中,参赛选手宿涵也曾宣传了其创业公司推出的AI歌词创作项目。本文即围绕人工智能歌词创作这一热门话题,对其主要应用的自然语言处理技术进行阐述,并介绍其相关应用。

1 自然语言处理的概述及应用

自然语言处理,英文名称是Natural Language Process(NLP),是人工智能领域的重要分支[1]。自然语言是人脑所特有的高级功能,自然语言处理即为利用计算机技术,通过相关算法对书面或口头形式的自然语言信息进行各种类型的加工或处理[2]。自然语言处理是实现人机交互的重要技术手段,也可以对语言信息进行分类或分析,其应用主要有机器翻译、情感分析、智能问答、语言生成、信息提取、语音输入、舆情分析等诸多方面[3]。

1.1 机器翻译

机器翻译是利用计算机将一种自然语言转换为另一种自然语言(目标语言)的过程。它在国内有许多比较成熟的应用,比如现在比较流行的有道翻译、百度翻译、谷歌翻译等等。

1.2 情感分析

情感分析在一些有评论机制的应用上非常有用,它可以把不同的评论通过分析归入到不同的情感标签中,比如判断评论是积极的还是消极的,根据一定的规则,在用户的评论区上显示。

1.3 智能问答

智能问答在一些电商网站上有很大价值,比如淘宝、天猫、京东等等。有些简单的问题并不需要人工客户来处理,智能问答可以解决用户的这些问题,从而省去大量的人力成本。

1.4 语言生成

语言生成主要应用在新闻和体育赛事解说上,系统通过自然语言处理将解说员的台词翻译成文字,实时显示在APP上,方便观众快速收到文字解说。

1.5 信息提取

信息提取主要应用在搜索引擎上,它们在采集大量的数据后,提取关键的信息进行自动分类。例如针对新闻的搜索页面,在应用了信息提取算法之后,进行主题的分析,可将不同的新闻归类到不同的主题当中。

1.6 语音输入

语音输入被认为是目前世界上最简便、最易用的输入法,在当前发展极为迅速。国内,科大讯飞是语音输入做得最好的互联网公司,它推出的同声传译翻译器,可以实时进行中英文的同声传译,在各大会议和赛事中得到广泛应用。

1.7 舆情分析

舆情分析在政府或企业的公关中起着十分重要的作用,美国前总统奥巴马在参与美国大选时,就曾多次利用輿情分析对资金和广告的投放进行调整、制作有效的拉票战术。自然语言处理在舆情分析中的应用,使得媒体界、公关领域的工作效率大大提高。

2 自然语言处理的技术原理

自然语言处理应用在生活中的很多方面,为实现这些应用,需对其技术原理进行深入剖析。本章将从自然语言处理最基本的词法和句法分析,以及机器翻译、情感分析、文本生成所采用的技术方法这几个方面展开论述。

2.1 词法分析

词法分析包括中文分词、词性标注和命名体识别。中文分词是指将连续的句子分割成完整的词汇序列;词性标注赋予了每个词特定的词性,如动词、名词等等。命名体识别是将专有名词进行识别,比如人名、地名。通过这三个步骤,词法分析可将自然语言进行初步分类,方便下一步处理。

2.2 句法分析

句法分析可以利用一句话中词与词之间的关系,来表示句中的语法信息。主要作用是精准理解输入者的意图,通过句法分析,抽取出语句中的主干部分,实现对语句的精准理解。

2.3 机器翻译的主要方法

2.3.1 基于规则的机器翻译

基于规则的机器翻译是通过词性分析、词语位置变幻等规则,把词或短语直接进行翻译,一般情况翻译质量较差。

2.3.2 基于统计的机器翻译

该种方法采用了统计学的相关理论,首先需要一个大的语料库,当翻译词时,会计算该词与其相邻词间的概率,然后选择概率最大的翻译结果作为输出,默认概率最大为翻译最准确。这种方法也是目前较为常用的机器翻译方法之一[4]。

2.3.3 基于实例的机器翻译

当需要输入一句话进行翻译时,会搜索出类似的语句,在有异常翻译的词语处进行直接替换,即可得到最终结果,翻译效果较差。

2.4 情感分析

情感分析是针对具有主观倾向的文体,如用户评论等。情感分析首先要提取文本中的关键情感词语,进行分类并给出相应的可信度,可分为积极、中性、消极。情感分析可以帮助商家理解用户的心理,显示一定情感比例的评论。还可以帮助企业进行热点分析、舆论监控,为企业的决策提供支持[5]。

2.5 文本生成

文本生成可基于关键词或基于一句话的文本进行再生成。第一步是要输入关键词或一句话,如果是关键词,系统会在基础语料库中筛选出含有这个关键词的语句,判断是否符合要求,不符合的话要对这句话在同义词语料库中进行同义词的替换,最后输出。

在文本生成同义句时,先要对已输入的语句进行分词,分词后如果两个语句词不同且语义不同,则不满足模板变换的条件,就要再去除停用词,对于剩下的词计算词距离,得到相似矩阵,对两个句子分别构建bi-gram统计向量,计算相似度。最后把所有句子由相似度高到低进行排序,根据需要的句子数量选取指定数量的句子。

3 人工智能歌词创作的主要方法

人工智能歌词创作的本质是采用了文本生成的相关算法。首先需要将自然语言数字化处理,即导入依赖,加载数据,创建映射,使每一个字符都可以映射到一个数字,然后进行数据预处理,将数据转换成可供模型训练的格式,再进行模型构建,最后应用相关算法生成文本,本文主要列举循环神经网络算法和LSTM算法这两种方法。

3.1 循环神经网络(RNN)算法原理

首先需要准备数据,循环神经网络RNN引入了隐状态h,可以对序列形的数据提取特征,也就是通过前几次输出的量,对输入的量进行判断与更改,用上一状态的输出量通过处理转化为新的输入量[6]。歌词向量化后输入x1,x2,……xn,该输入量通过与隐状态h的计算预测,输出y1,y2,……yn。预测效果会随着反复学习,逐渐优化。技术原理图如图1所示。

3.2 长短期记忆网络(LSTM)算法原理

上文提到的RNN具有一种重复神经网络模块的链式形式,即隐状态h。相较于RNN来说,LSTM不是单一的神经网络,它有四种特殊的交互结构。这种结构叫门,可以实现选择性地让信息通过。技术原理如图2所示。

数据通过遗忘门时,遗忘门会输出一个0到1之间的实数,1表示完全保留,0表示完全舍弃。输入门决定让多少新的信息加入,其中包含两个步骤,一个是sigmoid层决定哪些信息需要更新,另一个tanh层生成一个向量,也就是备选的用来更新的内容。这两部分结合起来,对其进行更新,会产生新的候选值,该值根据决定更新每个状态的程度进行变化。最后,需要决定输出什么值:(1)运行一个sigmoid层来确定细胞状态的输出部分;(2)把输入门的最終值通过tanh进行处理,得到一个值,并将它和sigmoid门的输出相乘;(3)输出所需的确定输出值,来实现文本生成[7]。

4 结语

基于自然语言处理技术的人工智能歌词创作虽然在诸多方面还存在着挑战,但毫无疑问,自然语言处理的发展前景是明朗的。通过自然语言处理的相关技术,我们可以将智能化带入生活的方方面面,实现机器与人之间的沟通,从根本上影响到人们的生活,意义深远,潜力无穷。相信随着智能算法的不断优化,AI技术将会在自然语言方面做到更多。

参考文献

[1] 奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465.

[2] 李彦峰.人工智能在自然语言处理中的应用[J].襄阳职业技术学院学报,2018,17(04):71-74+78.

[3] 李生.自然语言处理的研究与发展[J].燕山大学学报,2013(5):377-384.

[4] 李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755.

[5] 范创.人机对话中的情感文本生成方法研究[D].哈尔滨工业大学,2018.

[6] 王懿.基于自然语言处理和机器学习的文本分类及其应用研究[D].中国科学院研究生院(成都计算机应用研究所),2006.

[7] 于振龙.基于LSTM的自然语言生成技术研究与实现[D].北京邮电大学,2018.

猜你喜欢
自然语言处理应用
基于组合分类算法的源代码注释质量评估方法
多媒体技术在小学语文教学中的应用研究
词向量的语义学规范化