修辞结构理论与汉语篇章结构

2011-11-11 03:17胡苑艳陈莉萍
长春大学学报 2011年1期
关键词:树型语段语篇

胡苑艳,陈莉萍

(1.西安外事学院 民办教育研究所,西安 710077;2.南京师范大学 外国语学院,南京 210097;3.复旦大学 博士后流动站,上海 200083)

修辞结构理论与汉语篇章结构

胡苑艳1,陈莉萍2,3

(1.西安外事学院 民办教育研究所,西安 710077;2.南京师范大学 外国语学院,南京 210097;3.复旦大学 博士后流动站,上海 200083)

国外一批计算语言学研究者为开发语篇结构自动生成系统,以修辞结构理论为支撑,对大量英语语篇进行标注后发现,语篇中的修辞关系应加以限制,语篇的抽象结构应为树型图式。这些国外研究成果带动了汉语篇章结构研究的发展,汉语语篇也应由基本语篇单位构成,其抽象结构也应为树型图,但基本语篇单位的切分并不是以引导从句的连词或短语为标记而是以逗号为切分点。在对语篇中的修辞关系进行分析时,可套用修辞结构理论的关系集。

修辞结构理论;基本语篇单位;修辞关系;汉语篇章结构

语言学与计算语言学领域的研究者早就意识到自然语篇不是小句或句子的简单组合,语篇内含有复杂的篇章结构。研究者们纷纷从不同的角度对此进行过研究,有些研究着重于篇章中基本语篇单位,有些研究挖掘基本语篇单位之间的关系,还有一些研究试图建立篇章总的结构图。然而,所有这些研究都是零星的,集中于某一方面。最近,国外一批计算语言学研究者为了开发语篇结构自动生成系统,对自然语篇结构作了全面的研究。他们以Mann和Thompson的修辞结构理论为支撑,对大量的英语语篇进行标注,最后发现任何篇章都是由基本语篇单位组成,基本语篇单位不会相互重叠,而且有核心与辅助之分,各个层级的基本语篇单位之间都存在着修辞关系,这个关系最好以树型图显示。这一研究成果为汉语篇章结构研究带来很多启发。

首先,国外的研究将促使我们对汉语篇章结构进行深入研究。汉语中对字、词、句的研究远远多于对篇章的研究,到目前为止还没有产生较为完善的汉语篇章结构理论。其次,国外的研究将使我们思考如下的问题:汉语语篇的抽象结构是什么?该抽象结构是否能用树型图表示?汉语篇章的基本语篇单位是什么?语篇单位之间存在什么关系?这些关系与具体的词汇语法体现是否有相关性?本文将试图回答这些问题。

1 汉语篇章的抽象结构

国外研究者已经针对篇章的抽象结构作了大量研究,研究主要通过对篇章结构进行标注,并在标注基础上进行相关的归纳和总结来完成。研究结果表明:篇章的抽象结构或为树型或为曲线状。Carlson等在对语篇结构进行标注时,以修辞结构理论为支撑,同时对语篇单位间的修辞关系加以种种限制,最后篇章的总结构图呈树型。Wolf和Gibson在对语篇结构进行标注时,没有对语篇单位间的修辞关系加以限制,则最后篇章的总结构图呈曲线状。因此,Marcu认为两者之间存在的主要差别在于对语篇单位间的修辞关系所加限制的强与弱[1]。

Marcu曾做以下试验来比较两者之间孰优孰劣。

以下是6个基本语篇单位:

(0)Farm prices in October edged up 0.7%from September,

(1)as raw milk prices continued to rise,

(2)the Agriculture Department said.

(3)Milk sold to the nation's dairy plants and dealers averaged$14.50 for each hundred pounds,

(4)up 50 percent from September and up$1.50 from October 1988,

(5)the department said.

坚持篇章结构为树型的研究者认为,以上6个基本语篇单位可被分为两个语段,(0)-(2)组成第一语段,(3)-(5)组成第二语段。第一个语段为核心语段,第二个语段作为辅助语段,用具体事实对第一个语段进行解释阐述。另外,第一语段中的3个基本语篇单位可被分为两个层次,(0)-(1)为第一层次,(2)为第二层次。第一层次为核心层,第二层次隶属于第一层次,为辅助层。第二语段中的3个基本语篇单位同样也可被分为两个层次,(3)-(4)为第一层次,(5)为第二层次,隶属于第一层次。在(0)-(1)中,(0)为核心语篇单位,(1)是(0)的原因,为辅助语篇单位,在(3)-(4)中,(3)为核心单位,(4)对(3)作进一步阐释,为辅助单位。它们的总结构图如图1:

图1 树型结构图

坚持篇章结构为曲线状的研究者则认为,除了上述修辞关系外,(3)-(4)对(1)是一种阐释,而(2)与(5)间具有相似性,因此总结构图应如图2:

图2 曲线结构图

以上两幅图代表了两类对于篇章抽象结构的不同研究视角。图1中的信息似乎不如图2丰富,曾有研究者通过计算得出结论,认为图1省略了约12%的信息。然而,Marcu认为这12%的信息是人们在正常阅读过程中能够推断出的信息,无需明确标出。若语篇中的修辞关系被无限制地标出,则过于复杂的修辞关系将会使得篇章总体结构无法生成。

从国外关于篇章结构研究的总体趋势上来看,研究者较倾向于限制语篇中基本语篇单位间的修辞关系,他们认为篇章的总结构图应以树型显示。从计算语言学的角度来说,树型结构图更便于形式化。

汉语篇章结构的相关研究数量不多,目前也缺乏较完善的理论,但根据国外研究成果可以推断出,汉语篇章结构与英语篇章结构并没有质的区别。篇章结构是语篇中作者与读者之间交际意图的体现。虽然在具体的词汇语法体现中,不同语言之间存在差别,但意图间的修辞关系一致。因此,笔者认为汉语篇章结构的总体结构图应为树型。这也符合传统汉语的研究结论,汉语复句的抽象形式就呈现的是有层次之分的树型图式。

坚持汉语篇章抽象结构为树型图就意味在对汉语语篇进行标注时,应当对语篇中的修辞关系加以限制。具体的限制方法可以采用由Marcu[2]提出的两种限制模式:弱限制模式与强限制模式。弱限制模式是指,若语篇中的两个语段间存在修辞关系,该关系可以用两个语段所体现的语言关系或非语言关系加以解释,其中语言关系指的是语段的语义体现,非语言关系指的是语段所体现的实体、作者和读者的信念、态度和目标等。这一论点与Hovy[3],Moore和 Paris[4],Moore[5]的研究结果保持一致。

请看摘自汤正华的《机器人世界》中的一段话:

(0)目前,最大的机器人是美国制造的。(1)1974年曾用它来打捞一艘重4千吨的潜水艇,它的机器手可以把90米长的潜水艇从海底拦腰抱起。(2)最小的机器人用在日本精工手表装配线上。(3)这种微型机器人,如同百货商店玩具柜里最小的洋娃娃一般大。(4)它纤细的手臂和灵巧的小手指,十分精确地把一个个机芯装在流水般送来的一只只小手表壳里。(5)我国也生产了机器人,在我国西南原子反应堆上,机器人用那灵活的手,在人们无法接近的核辐射环境中,不知疲倦地处理着核燃料和核废物,工作得十分出色。[1]

这是一个摘自自然语篇的自然段落,由6个自然句组成。我们可以将这6个自然句分为3个语段,第一语段由(0)-(1)组成,第二语段由组成(2)-(4),(5)为第三语段。第一语段与第二语段间存在对比关系,将第一和第二语段结合起来看,它们与第三语段间同样存在着对比关系。语段之间的修辞关系可用各语段所建立的抽象结构加以解释,此为弱限制模式。举个例子:第一与第二语段间存在对比关系,该对比关系能通过美国与日本两个国家的概念对比来体现,也可以通过“潜水艇”与“洋娃娃”这两个实体间的抽象概念对比来体现。除了抽象概念以外,语段中的语义关系也可以对语段间的关系加以解释,例如第一语段中的“最大”与第二语段中的“最小”存在着明显的对比关系。

若两个语段中存在修辞关系,该关系可以用这两个语段中至少两个最重要的核心语篇结构之间的相似关系加以解释,此为强限制模式。同样以《机器人世界》为例。第一语段由(0)和(1)组成,前者为核心语篇单位,后者对前者进行例证,为辅助语篇单位。第二语段由(2)-(4)组成,(2)为核心语篇单位,(3)和(4)对(2)进行例证,为辅助语篇单位。第一语段与第二语段之间的对比关系完全可以由(0)和(2)这两个核心语篇单位间的关系加以解释说明。

强限制模式与弱限制模式的根本区别在于,强限制模式突显了语言的构造。弱限制模式提出语言关系和非语言关系可以对语段间的修辞关系加以解释,但迄今为止,尚未有任何研究成果指出如何才能准确无误地从文本中解析出非语言关系[1]。

2 汉语篇章中的基本语篇单位

基本语篇单位是篇章结构中的核心要素,篇章结构抽象图式或篇章总结构图都是基本语篇单位之间关系的体现。基本语篇单位研究应包括确定基本语篇单位的界限、确立基本语篇单位的属性、阐述基本语篇单位之间的关系。

2.1 确定基本语篇单位的界限

在确定基本语篇单位时,不同的研究者往往运用不同的理论。Givon[6]认为从句应该成为语篇的基本单位;Sacks[7]认为谈话的话轮应该成为语篇的基本单位;Polanyi[8]坚持语篇应该以自然句为切分单位;Grosz和Sindner[9]认为语篇的基本单位应该从语篇的上下文中获取,它是由一定的符号所反映的信息载体,能反映事物的单个状态或部分状态;最有影响的修辞结构理论认为从句应该是语篇的基本单位,不管从句有没有语法标记或词汇标记。

然而,在具体标注时,Marcu[2]等研究者对基本语篇单位进行了新的规定:所有有词汇或句法标记的起状语作用的从句都属于基本语篇单位,包括起状语作用的非谓语动词词组;充当主语、宾语、补语的从句不属于基本语篇单位;定语从句、后置的名词修饰短语或将其他基本语篇单位割裂开的从句或非谓语动词短语为内置语篇单位;除此而外,还有一定数量的有明显语篇标记的短语作为基本语篇单位,如由in spite of(尽管),according to(根据)等引导的短语。

虽然Marcu的切分方法被许多计算语言学领域的研究者所采用,理论也相对全面,但因为他的理论产生并运用于英语语篇,而英语语篇与汉语语篇之间存在着一定差异,所以在研究和确定汉语基本语篇单位时不可以完全照搬他的理论。在英语语篇中从句或充当从句的短语十分明显,但汉语语篇中从句往往是隐性的。例如:

海关和国税部门的执法人员,一上班便会打开电脑,看电子监督系统是否提示自己有过错;广东省撤消了799支不合格执法队伍,清退不合格人员1.1万多人;公安部去年查阅各类执法卷宗23万卷,整改1.3万余个执法问题……去年7月,国务院办公厅下发《关于推行行政执法责任制的若干意见》,正式在全国推行行政执法责任制。一年来,该制度成为约束行政执法者的“紧箍咒”,让依法行政、科学行政落到实处,提高行政水平和效能。[10]

整个自然段包含三层含义:《意见》执行细节,《意见》下发,总结《意见》的效果。然而,段落中没有明显的连词标记。相反,段落中的标点符号发挥着切分和连接语篇单位的作用。在“海关和国税部门的执法人员……有过错”中,第一个逗号将动作的执行者与具体动作以及对象隔开,凸显动作执行者。第二个逗号将具体动作与动作的目的隔开,以凸显目的。在“海关和国税部门……整改1.3万余个执法问题”三句话中,分号起着连接的作用,连接三个具体执行《意见》的细节。句号、问号、感叹号往往作为句子的终结点表示句子意义的结束。

在现代汉语中,虽然各种标点符号都各有其责,但逗号具有特殊的用途。通常情况下,逗号是用来分隔语篇单位的,被逗号分开的语篇单位都含有语句要素,以及概念层次网络理论中所指的核心语义块,或是特征要素、作用者、对象和内容,或是手段、工具、途径、比照、条件、原因、结果和目的,或是时间、空间等要素,要不被逗号隔开的就是这些语句要素的组合。例如在“一年来,该制度成为约束行政执法者的‘紧箍咒’,让依法行政、科学行政落到实处,提高行政水平和效能”这句话中,第一个逗号将时间要素与核心语篇单位隔开,该核心语篇单位是语句要素的组合,第二个逗号将核心语篇单位与目的要素隔开,第三个逗号将两个并行的目的隔开。

一般情况下,被逗号隔开的语篇单位都以单句或相当于单句的短语结构形式出现,因此,逗号本身就起着单句切分的作用。鉴于逗号在现代汉语语篇中的特殊功能,笔者坚持逗号作为最基本语篇单位的切分标记。

2.2 语篇单位的属性

所谓语篇单位的属性,就是指确定基本语篇单位之间的主辅关系。Mann和 Thompson[5]以词汇和语法标记,特别是连接词来确定基本语篇单位之间的主辅关系。例如,凡是有从属连词连接的状语从句都为辅助语篇单位,没有连词连接但发挥状语从句功能的非限定性动词短语都为辅助语篇单位等。

汉语语篇中连接词出现的概率相对较低,如果仅仅靠语法标记词来确定主辅关系难度较大。事实上,可以从另一个角度来确定主辅关系。根据概念层次网络理论,自然语言语义体现于三组概念,这三组概念分层次以网络化的形式呈现,它们是基元概念语义网络、基本概念语义网络、逻辑概念语义网络。基元概念语义网络的一级节点分为两大类,一类是主体基元概念,另一类是复合基元概念。主体基元概念有6个一级概念节点,分别是作用、过程、转移、效应、关系和状态,它们构成作用效应链。复合基元概念主要涉及人类活动,共设置了8个一级概念节点,根据人类活动的语境特征划分为3个层次,即生理本能活动、一般理智活动和社会性活动。基本概念语义网络共有9个一级概念节点:序及广义空间,时间,空间,数,量与范围,质与类,度,客观的基本属性,含主观评价的基本属性。逻辑概念语义网络分为两类:一类是语言逻辑概念,大体上相当于汉语的虚词;另一类是基本逻辑概念,有两个一级概念节点,即比较和基本判断。

就基元概念语义网络与基本概念语义网络来讲,前者为主后者为辅,因为人类活动及事物的发生和发展是自然界的主体,而时间、空间等是为主体服务的背景因素。在三大概念语义网络中,逻辑概念语义网络兼有主辅两种特征。当逻辑概念相当于汉语中的虚词时,含有该逻辑概念的语篇单位为辅助性的。当逻辑概念表现为比较或基本判断时,体现该逻辑概念的语篇单位为主体性的,因为比较和判断系人类思维活动。

就每一个概念语义网络本身而言,所有一级节点概念为主体性的,而二级节点的概念为辅助性的,因为后者往往是对前者作进一步的补充说明。依此类推,就二级和三级节点的概念而言,前者为主体性的,而后者为辅助性的。处于同一层次的概念节点,一般情况下,它们是并列的,但主体基元概念是例外。

主体基元概念有6个一级概念节点共同构成作用效应链,但它们有主次之分。作用存在于一切事物的内部和相互之间,作用必然产生某种效应,在达到最终效应之前,必然伴随着某种过程或转移。如果把作用效应链比作为是一趟行程,那么作用是起点,效应是终点,中间伴有过程、转移、关系和状态。对于具体的行程,起点以及中间的诸因素都很重要,但达到目的地是最重要的。因此,在作用效应链中,作用永远是辅助性的,而效果永远是主体性的。在作用与过程等因素之间,作用是辅助性的,而过程等是主体性的。在过程等因素与效应之间,过程等因素为辅助性的,而效应为主体性的。在具体的过程、转移、关系和状态之间,可能没有主次之分是并列的,也有可能是某一因素导致另一因素的产生,那么前者为辅助性的,而后者为主体性的。

比较与判断也与作用效应链中的6个概念节点处于同一层次。一般情况下,当作用效应链中的某一概念节点与比较判断共现时,含有比较判断的语篇单位往往为主体性的。

决定语篇单位之间的主次地位是一项很复杂的任务,其中涉及到诸多的因素,但总的原则是:人类活动与事物的发生与发展为主,时间空间等因素为辅;结果为主,原因为辅;总述为主,细节为辅;实现的结果为主,实现的过程为辅。

2.3 语篇单位之间的修辞关系

修辞关系是指文本的作者在表达中组织思想观点的模式,该关系也体现了语篇中概念连接的方式。对于语篇的修辞关系,特别是思想观点的组织模式,国外研究者对英语语篇进行了大量的研究。他们认为语篇中修辞关系,是由语言本身的功能,即概念功能、人际功能、语篇功能决定的。相比较而言,汉语在这方面的研究还较缺乏。既然语言的三大功能在语种上没有差异,因此,笔者认为在分析汉语语篇结构时可以采用Mann和Thompson提出的修辞关系。他们在研究中明确指出,修辞关系是一个开放性的关系集,所谓开放性的,就意味着读者在给定话语的内部可以定义出其他的关系类型。Marcu[2]根据标注的语料库总结出53种单层核心关系以及25种多层核心关系,该78种定义关系又被分为16个组别,每组具有的修辞功能均相同。我们可以以此类推,汉语语篇中的修辞关系也可以扩展。

基本语篇单位之间的修辞关系与语法词汇实现之间存在一定的相关性。英语语篇中修辞关系通常借助于引导从句的连词实现的,汉语也是借助于一定的语言形式,尽管并非全部是连词或连词性短语。例如,汉语语篇中的解证关系常用的词语为:像、如、例如、比如(说)、举例(说)、据说、这就是说、也就是说、换句话说、用通俗的话来说、那就是(说)、所谓、意思是(说),可以说、当然、总之、总而言之等等。即使以语意来接应的也会体现于一定的词汇语法现象中,例如运用反复辞格或重复关键性词语等。

综上所述,汉语语篇与英语语篇一样,是由基本语篇单位构成的,其抽象结构也是树型图,有所不同的是,基本语篇单位的切分不是以引导从句的连词或短语为标记而是以自然句的逗号为切分标记。在阐述汉语语篇中基本语篇单位的属性和修辞关系时,可以套用修辞结构理论的定义关系集,并根据汉语语篇的特点进行扩充和完善。

[1]陈莉萍.汉语语篇结构标注面临的挑战与对策[J].南通大学学报:社会科学版,2008(5):76-82.

[2]Marcu D.The Theory and Practice of Discourse Parsing and Summarization[M].Cambridge:MIT Press,2000.

[3]Eduard Hovy.Automated discourse generation using discourse structure relations[J].Artificial Intelligence,1993,63(1/2):341-386.

[4]Johanna Moore,Cecile Paris.Planning text for advisory dialogues:capturing intentional and rhetorical information[J].Computational Linguistics,1993,19(4):651 -694.

[5]Johanna Moore.Participating in Explanatory Dialogues:Interpreting and Responding to Questions in Context[M].Cambridge:MIT Press,1995.

[6]Talmy Givon.Topic continuity in discourse[C]∥Topic Continuity in Discourse:a Quantitative Cross-Language Study.Amsterdam:John Benjamins,1983:1 -41.

[7]Harvey Sacks,Emmanuel Schegloff,Gail Jefferson.A simple systematics for the organization of turntaking in conversation[J].Language,1974,50:696 -735.

[8]Livia Polanyi.A formal model of the structure of discourse[J].Journal of Pragmatics,1988,12:601 -638.

[9]Barbara Grosz,Candice Sidner.Attentions,intentions,and the structure of discourse[J].Computational Linguistics,1986,12(3):175-204.

[10]陈莉萍.关于英语语篇结构标注研究综述[J].外语与外语教学,2007(7):9-10.

Rhetorical Structure Theory and Chinese text structures

HU Yuan-yan1,CHEN Li-ping2,3

(1.Research Institute of Private Higher Education,Xi'an International University,Xi'an 710077,China;2.School of Foreign Languages and Cultures,Nanjing Normal University,Nanjing 210097,China;3.Mobiles Station for Post-doctors,Fudan University,Shanghai 200083,China)

In order to develop automatic summarization systems,a group of computational linguists annotated a large number of English texts on the basis of Rhetorical Structure Theory,from which they inferred that rhetorical relations between elementary discourse units should be restricted and the abstract structures of texts should be tree-type graphs.This result has brought profound implications for the research on Chinese text structures.Based on the research done by foreigners,it can be concluded that Chinese texts consist of elementary discourse units and their abstract structures should be tree-type graphs.However,what is different is that elementary units in Chinese texts are signed by comma instead of subordinate clauses beginning with functional words or phrases.In the course of analysis of Chinese texts,Rhetorical Structure Theory can be referred to or even applied directly.

Rhetorical Structure Theory;elementary discourse unit;rhetorical relation;Chinese text structure

H315

A

1009-3907(2011)01-0039-05

2010-12-02

上海市哲学社会科学规划课题研究基金项目(2006EYY002)

胡苑艳(1984-),女,江苏南京人,研究员,助教,英国爱丁堡大学硕士研究生,主要从事语言学及应用语言学研究;陈莉萍(1966-),女,江苏盐城人,教授,博士研究生导师,博士后,主要从事语言学及应用语言学研究。

责任编辑:柳 克

猜你喜欢
树型语段语篇
勘 误
一种快速养成的柞树树型—压干树型
新闻语篇中被动化的认知话语分析
【重点】语言文字运用:语段压缩
浅谈低年级语段仿写的指导策略
基于树型结构的防空力量配属方案生成模型研究
树型组织结构图的算法研究及实现
从语篇构建与回指解决看语篇话题
语篇特征探析
依存消解、一致性计算与浮现和语段计算理论