基于小型自建语料库谈狄金森诗歌的主题意义

2014-09-18 07:23许展
关键词:狄金森语料库检索

许展

(洛阳理工学院外语系,河南洛阳 471023)

基于小型自建语料库谈狄金森诗歌的主题意义

许展

(洛阳理工学院外语系,河南洛阳 471023)

利用自建小型狄金森诗歌语料库,采用基于语料库的语言学研究方法,对艾米莉·狄金森的诗歌进行批量分析和个案细读,探寻其诗歌创作的生命力所在,揭示她诗歌中生命、爱情与死亡等主题所存在的内在联系及意义。

狄金森;语料库;诗歌创作;主题意义

一、研究设计

语料库是指大规模自然语言文本的结合。[3]因此,建立语料库的前提是拥有语料库文本。狄金森的诗歌有很多版本,为了能够使自建语料库更具代表性,本研究选取了由狄金森两位好友托马斯·温特沃斯·希金森和梅布尔·托特共同主编的 《狄金森诗集》第一辑以及第二、三辑共165首诗作为原始语料。在获取电子文本后笔者对语料进行了相应的加工和处理。具体措施是采用文本整理器3.0对原始语料文本进行了清理,将电子文本中不合规范的符号、格式等加以修改,以便于后续的统计和数据分析。研究设计的第二阶段是借助语料库,使用语料库检索工具从语料库中提取所需信息。具体方法是利用语料库检索工具,在语料库中检索词、短语或其他词项并显示它们的上下文语境,从而产生语境共现行、词频表和关键词表等。[4]本文使用的是由日本早稻田科学工程学院科学工程英语教育中心开发的一款绿色免费语料库检索工具AntConc 3.2.1w。最后将经过检索的有关数据和信息进行分析,发现隐藏于狄金森大量诗作中的语言信息,从而阐释其创作特点和主题意义。

二、研究实施

本研究中自建小型狄金森诗歌语料库共有28 809个形符(tokens)和6 181个类符(types)。研究主要是通过观察词表、生成词簇表、检索关键词、索引行分析以及语境共现功能来实施。

(一)观察词表(Word list)

本研究首先对所建语料库进行词表检索,发现高频词均为一些功能词,而其中第一人称代词“I”是除了冠词之外出现最频繁的词,这一现象说明了一方面,诗人的生活范围拘囿,少于人来往,因此诗歌内容多围绕自我生活展开,另一方面也凸显了狄金森对本我真意的探寻和思索。在多年离群索居,自我封闭的隐居生活里,狄金森的心路历程并不单调,她内心世界丰富细腻,因此她的诗歌多以个人主观感受和情绪做参照。

另外通过观察,可以发现,词表中从1到12出现频次在200次以上的高频词(Frequency,缩写为Freq)和从13到30出现频次在100次及以上的中频词汇多是一些不超过7个字符的简单词,说明狄金森创作力求简练,避免使用拼写复杂的词汇,寥寥数笔,用简单的语言将各种意象囊括诗中。正如评论家所指出的那样:“她(狄金森)总是力求用一种露珠般凝缩而闪光的语言表达或包容她的思想。”[5]

由词表分析可以看出,狄金森的诗歌创作以个人生活为蓝本,用简单凝练的语言充分表达了自我意识和内心的真情实感,从而创作出了极富感染力和生命力的诗歌。

(二)生成词簇表(Cluster list)

词簇指的是在语料文本中反复出现的两词或两词以上的结构。[6]词簇表可以帮助我们获得词表中所列单词的上下文语境信息,从而进一步了解单词所在文本的宏观语言特征。

以 “I”为中心词,设定词簇长度为3到4词,最低频数为1次,可以生成词簇表,得到狄金森诗歌中与 “I”搭配的所有词簇。其中,前十个高频词簇中有“I could not”、“I don't”、“I never saw”和“I would not”四个为否定句式。进一步利用索引工具检索出语境共现行,如 “I could not fix the year”,“I could not hope to win”,“I could not die with you”,可以看出,狄金森诗歌中大量存在的否定形式对生活中的缺憾、痛苦的写照,同时,这种自我的否定是与其审美立场、自我人格相联系,是其精神世界的核心组成。[7]此外,前10个高频词簇中还有 “I wonder if”、“If I should”、“And if I”三个条件句式,进一步利用索引检索语境共现行,可以看到包括上述三个条件句式的原诗句,例如 “I wonder if it hurts to live”,“If I should fail”,“If I should die”,“If I should disappoint the eyes”等。由此可以看出,狄金森的诗歌中充满了自我否定和自我怀疑,这种否定和怀疑加重了她人生痛苦的体验。在狄金森的一生中,创作诗歌几乎是她全部精神寄托所在,与其生命历程紧密相连,她对自我价值的不确定和犹疑都体现在她的诗歌中,因此,只有进一步理解了她诗歌的主题意义才能真正体会她对生命如此浓重的缺失感和卑微感。

(二)主题词检索

在上表中,“痛苦”的关键性值是527.585,这说明女诗人内心世界充满强烈的失落与痛苦。“Death”是另一个关键值位居前列的实义词,说明死亡在狄金森的诗作中被反复吟咏。另外,检索显示,“thee”的关键性值为249.044,表明了该词也是狄金森诗作区别其它文本的一个显著文体特征。Thee在古英语中意为 “君”的意思,是thou的宾语形式。狄金森的很多代表诗都以“君”作为称呼, “君”被女诗人视作永久的爱人。在诗歌中,狄金森大胆地直呼对方,表达心中隐秘的爱意。由此看出,爱情也是狄金森诗歌中反复出现的主题。

除了看高频词汇外,还需要研究中段词汇,因为中频词汇能够帮助我们了解语篇的意义和全面了解作者的意图,[9]检索出的中频词汇包括summer(Freq.121.906),bee(Freq.104.418),children(Freq.83.747),flowers(Freq.82.636),breezes(Freq.81.920),dews(Freq.78.433)等各种自然事物和现象的词汇,显示出狄金森从细微处见真章,通过对自然细节的观察来展开对自然的描写。

由以上分析不难看出,狄金森的诗作多围绕生命,死亡,爱情,自然等具有哲学思想的人生大命题展开。

(三)索引行及语境共现分析

全文检索和词语索引是语料库检索中最基本的分析手段。词语索引最常见的形式是语境共现(Concordance),又称语境中的关键词(Key word in context简称KWIC)。它是某一检索词在被检索的语料文本中所呈现的语境共现行的列表。[10]在本节研究中,通过关键词索引导出批量语境共现行,观察语境词及周边词汇的搭配情况,并人工选取有代表性的整篇诗文进一步查看,从而解释狄金森诗歌所呈现的主题意义。狄金森善于观察生活,她的许多诗歌都反映了她对生命意义的思考,使用软件对生命 “life”一词进行检索,可以得到观察语料库中包含“life”的所有61条语境共现索引行(只显示部分摘录行):

1、Life is but life,and death but death!

2、The grave would hinder me,And life was not so ample

3、Each life converges to some centre,Expressed or still

4、Ungained,it may be,by a life's low venture,

5、My business,——just a life I left,Was such still dwelling there?

6、My life closed twice before its close;It yet remains to see

7、Inherited with life,Belief but once can be;

点击浏览文件(File View),我们可以查看有关 “life”的完整诗文。其中,下面这首诗也许能够解释狄金森诗歌中浓厚而深重的 “痛苦”:

根据史料和学者考证,狄金森性格内向,不爱交际,在其短暂的55年一生中,她大部分时间都闭门不出,终生未嫁,然而女诗人的内心却细腻敏感,在她所居住的小镇,经常有丧事发生,而她自己的亲人和密友也有人陆续离世,她因此感叹已失去了两位亲人,那两次生离死别是如此绝望,使与世隔绝的她承受了非凡的孤独与痛苦。可是,她依然不知道,上天是否还安排了三次。在这样一首短小的诗歌中,在这样一种不动声色的语境中,狄金森其实表达了对直面生命的痛苦,和对希望与爱的永恒追求。

狄金森一生未嫁,但她也曾经在心里默默地爱过三个人,一个是并不欣赏她的才华的编辑,一个是牧师,只见过两次面;还有一个法官,是一个有妇之夫,这三段爱情非但没有在对方心里掀起狂风大浪,甚至别人根本就没有注意过她的存在,谁会想起这个害羞,较小,外貌平凡的女子?但她却像飞蛾扑火一样,一往情深地在诗中表达着自己对爱情的向往和为爱献身的精神。选取 “thee”作语境共现处理,得出检索结果如下(只显示部分摘录行):

1、With but a fraction of the love,Poured thee without a stint.

2、Say quick,that I may dower thee with last delight I own!

3、Some distant heaven,Dwell timidly with thee!

4、Summer for thee,grant I may be;

5、I did always love,I bring thee proof.

6、slowly,Eden!Lips unused to thee,Bashful,sip thy jasmines

7、Think of it,lover!I and thee Permitted face to face to be;

选取语境共献第4行,“但愿我是,你的夏季”来分析狄金森真挚炽烈的感情:

诗人把自己比作 “夏日的音乐”,想象在夏日的阳光下,为爱人歌唱,当夏景不再就化作专为爱人而怒放的 “秋牡丹”,心甘情愿任他采摘。体现了诗人愿意体验爱情的甜美与痛苦,直至山无棱,地无痕,才敢与 “君”绝的执著与忘我。但她追逐爱情的路并不平坦,因此她把自己的爱埋藏在心底,这种秘而不宣的爱意与她对死亡的思考时常同时体现在狄金森的诗作中。

在狄金森描写自然的诗歌中,她将动物拟人化并赋予其精神,例如她描写蜜蜂,“His feet are shod with gauze/His helmet is of gold/His breast,a single onyx/With chrysoprase,inlaid/His labor is a chant/His idleness a tune…”将蜜蜂的触角,外形以及工作的形象刻画的栩栩如生。似乎蜜蜂是一个骄傲、充满活力而又朝气蓬勃的绅士。而狄金森显然倾慕这派头十足的 “蜜蜂绅士”。但她又有意克制着自己的爱恋之情,检索 “bee”的语境共现行,可得到35条,并摘录如下:

1、——Birds,hours,the humble-bee:

2、When landlords turn the drunken bee Out of the foxglove's door

3、It goads me,like the goblin bee,That will not state its sting.

4、Did the harebell loose her girdle To the lover bee,

5、Barbs has it,like a bee.

选取其中“To the lover bee”的语境共现行,在浏览文件视窗内查看:

“如何蓝铃花为爱慕她的蜜蜂,松开她的腰带,蜜蜂是否还会一如既往,对她虔诚崇拜?”[11]在诗中,追逐鲜花的蜜蜂是男性的意象原型,“蓝玲花”则是被追求的女性。狄金森没有直接描写爱情,而是将求爱的过程暗喻为蜜蜂追逐鲜花,爱情中征服与被征服的角色变换在她的笔下富有情趣且寓意深长,使人不禁联想到狄金森个人的感情生活,难道,正是狄金森对收获爱情后男人的忠诚心存疑虑,担心为爱付出一切而不能永远在一起才终生未嫁,孑然一身直至终老吗?

不仅仅是蜜蜂和鲜花,狄金森笔下的绿草、树林、微风等自然意象都渗透着她对爱情与死亡的思考。她在诗歌中考量着人与自然,人与人之间的关系,并通过自然万物来抒发她自我的心灵之景。

此外,狄金森对死亡与痛苦有着天然的洞察力,这种对死亡的独特理解体现在她的诗歌中。然而,狄金森并不是单纯地描写死亡,而是着力描写死与生的关系,死亡与爱情的关系,死亡与永恒的关系。[12]在以 “Death”为主题词进行检索后,得到43条语境共现行 (部分摘录如下):

1、Prove piercing earnest,Should the glee glaze In death's stiff stare

2、I am told;The reason deeper lies,——Death is but one and comes but once

3、Life,and Death,and Giants Such as these,are still.

4、I have no life but this,To leas it here; Nor any death

5、Love is anterior to life,Posterior to death,Initial of creation,and the exponent of breath.

6、I go no more away.For visitor,or sundown;Death's single privacy,

7、Because I could not stop for Death,He kindly stopped for me;

选取“Because I could not stop for Death(因为我不能停步等候死神)”这一索引行查看原诗文:

诗中死神(Death)似乎是一个顺从而殷勤的绅士,来接诗人和她的女伴——不朽 (Immortality)。诗人禁不住软磨硬泡,上了死神的马车。死神从容不迫地驾驶着车,他彬彬有礼的态度使诗人的态度发生了大的转变,从不情愿到敞开心扉,而一旦女诗人不再有所保留,死神即刻就揭去了他温情脉脉的面纱,飞快的驾驶马车穿越日夜和四季的轮回,直至驶入永恒的居所——坟墓,而这时女诗人才如梦方醒,却也奈何不了。诗人将死神描写为追求自己的情人,而她对这个情人暧昧和犹疑的态度正说明了女诗人内心的矛盾:对生活的留恋和要离世的无奈。诗人将生与死的矛盾冲突置于特定的氛围之中,烘托出人类面临死亡时的复杂心态。[13]然而,死亡并不是终结,而是爱情的开始,死亡是爱通向永生的道路,但 “永恒”是否就能够 “不朽”,狄金森以诗的方式留下了思索的空白。

三、结语

语料库在语言处理和文体分析方面功能强大,不但能够捕捉到大量真实的语言实例,还能够发现词汇、句型、语篇等层面的语境意义,将宏观与微观的研究相结合。本文利用语料库观察词表及词簇表,主题词检索和索引行分析等手段,通过批量诗分析总结共性和个别诗细读发现个性相结合的研究,对狄金森的诗歌创作和主题意义进行了探析。研究发现女诗人作为浪漫主义时期的代表诗人,其诗歌 “上承浪漫主义余绪,下开现代主义先河”,[14]写作风格凝练但富有感染力,虽然创作出发点多为身边小事,日常琐碎,但她用细腻的笔触歌咏了生命的痛苦、爱情的甜蜜,自然的生发,死亡的痛苦,并探索了自然与爱情,死亡与生命,死亡与爱情的关系,其诗歌富有内在生命力,极具可读性。

[1]刘保安.近五年来国内的狄金森研究综述[J].外国文学研究,2004(5):154-158.

[2]梁茂成,李文中.语料库应用教程[M].北京:外语教学与研究出版社,2010:70.

[3]道格拉斯·比伯,苏珊·康拉德著.刘颖,胡海涛译.语料库语言学 [M].北京:清华大学出版社,2012:8.

[4]何安平.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2010:12.

[5]狄金森著,江枫译.狄金森诗选[M].长沙:湖南人民出版社,1984:19.

[6]梁茂成,李文中.语料库应用教程[M].北京:外语教学与研究出版社,2010:84.

[7]金文宁.以自我否定形式成就自我——艾米莉·狄金森诗歌创作论 [D].上海:上海外国语大学,2010.

[8]桂诗春.基于语料库的英语语言学语体分析 [M].北京:外语教学与研究出版社,2009:52.

[9]梁茂成,李文中.语料库应用教程[M].北京:外语教学与研究出版社,2010:78.

[10]何安平.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2010:14.

[11]狄金森著,江枫译.狄金森诗选[M].长沙:湖南人民出版社,1984:52.

[12]杨甸虹.爱情·死亡·永恒——艾米莉·狄金森诗歌解读[J].四川外语学院学报,2001(3):37-40.

[13]刘文哲,刘立辉.文本·死亡·自我——艾米莉·迪金森死亡诗歌结构形式解读[J].外国文学研究,1993(1):10-14.

[14]狄金森著,江枫译.狄金森诗选[M].长沙:湖南人民出版社,1984:19.

(编辑:佘小宁)

A Corpus-Based Study on Dickinson's Poetry Creation and Themes

XU Zhan
(Foreign Languages Department,Luoyang Institute of Science and Technology,Luoyang Henan 471023,China)

Based on the Self-built Dickinson's Poetry Corpus,the paper applies the corpus-based linguistics to analysis of Dickinson's poetry creation and themes.Through the batch quantity analysis and case study,it points out that Dickinson's poetry is full of vitality and reveals the inherent relationship between Dickinson's main themes:life,love,nature and death.

Dickinson;Corpus;Poetry creation;Themes of the poetry

I106.2

A

1671-816X(2014)02-0189-07

艾米莉·狄金森是一位在美国文学史上占据重要位置的浪漫主义时期女诗人,国内学者从各个角度对其诗歌进行了广泛而深入的研究,有些研究聚焦诗人隐居,终身未嫁的情感方面的原因,有的从诗歌的主题:爱情与友谊、死亡与永生、自然与宗教、诗歌艺术等方面进行研究,有的从她诗歌的风格入手分析标点符号、语言技巧、意象、韵律等艺术形式,研究者们还运用各种现代文学批评理论,如精神分析、女权主义、新批评、结构主义、文学符号学、原型批评等研读狄金森作品,对其创作思想进行了全方位的解析。这些研究无疑为我们理解和赏评狄金森的诗歌提供了一定的理论框架和指导,但还是存在着一定的局限性。正如国内学者刘保安在其论文中所指出的, “国内的狄金森研究视野还不够开阔”,“客观上的资料匮乏和主观意识上的创新不足”使得国内狄金森研究有明显的重复性。[1]笔者认为,这种重复性还体现在大部分的分析都是个案研究,即只选取诗人的某一篇或某几篇诗歌进行分析,而不能大批量的分析,从而更好地反映其全局思想和脉络。近年来兴起的语料库方法能够使研究者将批量研究和个案研究相结合,既能够 “自上而下”,对数量庞大的语料库索引进行解读和概括,并通过直觉和经验对数据进行“归约”,同时也具有 “自下而上”的成分,通过有效地抽样对卷帙浩繁的文学作品进行分析,发现隐藏于文本之后的语言特点和事实。[2]这种将定性与定量研究相结合的方式,能够帮助研究者找到语言使用者使用语言时的共性特征和典型特点,提高研究的信度和准确度。笔者通过搜素CNKI期刊文献库查找到关于研究狄金森诗歌的论文近300篇,但尚无一篇是基于语料库方法对其进行的研究。本文采用基于语料库的语言学研究方法,对自建小型狄金森诗歌语料库进行研究,旨在通过技术手段来探寻其诗歌创作的生命力所在,为其诗歌传达的主题意义提供佐证。

2013-09-06

许展 (1984-),女 (汉),河南洛阳人,硕士,主要从事英美文学、文化和翻译方面的研究。

河南省社科联、河南省经团联调研项目课题一般项目(SKL-2013-1195)

的另一种说法是关键词,而判断的标准则是关键性(Keyness)。关键性分析主要是把观察语料库和另一个参照语料库比较,找出观察语料库哪些词是超用的,有哪些词是少用的,从而提供语篇层面词语的显著分布和文本主题的关系,用来研究语篇和语域特征。[8]本研究中的参照语料库是自建的美国文学语料库,其中包括小说及短篇故事部分24个、诗歌72个、戏剧3个三大类,共99篇,类符数为40 463,形符数为1 377 976。对观察语料库进行主题词检索后得到的列表显示如下:

猜你喜欢
狄金森语料库检索
如果记住就是忘却
如果记住就是忘却
《语料库翻译文体学》评介
与狄金森一起尝试思考
我的朋友
专利检索中“语义”的表现
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
国际标准检索
国际标准检索