《读史方舆纪要》数据库建设中地名解析的原则与方法

2014-02-28 02:16刘龙雨
关键词:政区青城条目

刘龙雨,胡 迪

(1.南京师范大学 社会发展学院,江苏 南京210023;2.南京师范大学 虚拟地理环境教育部,江苏 南京,210023)

目前,借助GIS技术进行历史研究已经成为GIS技术与历史学界的一股潮流。现已有多家机构将历史GIS作为重要研究方向之一。要表达历史事件的四大要素:时间、地点、人物、场景,除了清楚时间因素,首要任务就是搭建“舞台”——研究历史自然地理和历代行政区划变迁。

《读史方舆纪要》(以下简称《纪要》)是明末清初顾祖禹的一部历史地理名著,它以明末政区为纲,叙述和考辨唐虞三代以迄明代地名的沿革,包含的地理沿革信息系统而全面。不仅如此,由于作者参采众书,考订精审,其准确程度甚至超过徐霞客根据实地考察所著的《徐霞客游记》,因此成为考证地名、研究历史变迁与历史军事地理必备的工具书。此外,这部书的“组织及其研究方法,真算得治地理学之最好模范”[1]。《纪要》全书内容分为三个部分:第一部分,卷一至卷九分析历代州域形势,这9卷是全书的总括,简要介绍了各省在各个朝代的军事地位。第二部分,卷一〇至卷一二九为各省形势及川渎异同,这120卷是全书的主要内容。该部分以明代最高行政区划——二京十三布政使司(俗称十五省)为纲,按府州县分叙四至八到,历代沿革,境内的名山、大川、城镇、关隘、古迹等,均说明其方位、相关历史事件等。府州县地名与境内所辖地名地物,以不同的文字格式加以区别。每省卷末有《附见》内容,叙述各省军事卫所及当时所称的“外国”地名,并通过不同文字格式标示出不同地名间的类型区别。此外附有《川渎异同》一卷,将黄河、长江、运河、淮河等重要河流分叙源流。第三部分,卷一三〇,就1卷内容,这部分以地图与表格为主,每幅地图以网格形式分绘各布政使司政区,表格则列出该政区下属各级地名实体的方位、沿革、地位、赋税、面积等等,可与第二部分各卷所记内容互相印证。根据《纪要》这种写作特点,笔者认为,第二部分是构建数据库的关键和主要部分,因此以第二部分为例对地名入库的原则与方法进行研究。以《纪要》为例来探索专门针对某一种古籍资料建设GIS系统,对于以古籍为主要资料建立统一时空框架下的大的历史GIS系统是一种有益的尝试,对于历史学者及历史地理学者,能够使其对《纪要》中的地理信息产生更直观的印象,加之便捷的检索系统,更容易理解地理现象演变过程,找出其中的问题与规律。因此,本文以贺次君、施和金点校,北京中华书局2005年出版的《纪要》中的第二部分为例,探讨历史GIS数据库建设的首要问题,即地名信息解析的原则与方法,共包括四个方面。

一、地名条目鉴别与分割

根据《纪要》内容提取出地名记录,每一条记录称为一个地名条目。根据《纪要》的行文特点,本文确定了地名条目鉴别与分割的四个原则。

(1)按照段落自然划分的条目。《纪要》正文中每段文字必以一个地名作为开始,绝无例外,如:

大兴县,附郭,在城内东北隅。秦置蓟县,汉以后因之,州郡皆治此。辽改曰蓟北县,寻又改为析津县,金贞元二年改曰大兴。今编户三十六里。(《纪要·北直一》)

这一完整的段落包含且仅包含了大兴县的沿革信息,自然无须特别鉴别与分割,本身就是一个条目,判断起来十分容易。但《纪要》规模庞大,所包含的信息也非常丰富,若都照这样划分段落,则段落将增加数倍,且有的段落文字非常短,因此对于一些地理位置相近的地名,作者并没有单列出一个段落来记述,而是附在一个主要地名之下。基于此,本文制定了分割条目的第二个原则。

(2)在一个自然段内,凡是有“○”标记的地名,一般为一个新地名,例如:

阴乡废县,府西南二十五里。汉置阴乡县,属广阳国,后汉省。其遗址俗谓之笼火城。唐武德三年,窦建德遣将高士兴击罗艺于幽州,不克,退军笼火城。艺袭击,大败之。未几,复败建德军于笼火城是也。○玉河废县,在府西四十里。本蓟县地,五代时刘仁恭置。《辽志》:“仁恭于大安山创宫观,师炼丹羽化之术于方士王若讷,因分蓟县,置此县以供给之。”辽亦为玉河县,今废。(《纪要·北直一》)

在这段文字中,前一部分是描述阴乡废县的沿革,但后半部分附入了玉河废县。玉河废县与阴乡废县都位于“府西南”,除位置相近外并没有其他联系,作者仅为行文简练而将玉河废县附入,用“○”符号与前一个地名加以分隔,因此本文将这段文字分为“阴乡废县”与“玉河废县”两个地名条目。考察《纪要》中其他“○”之后的文字,无不是与原文所记地名关系不甚密切的另一条记录,因此,笔者认为,凡是“○”后面的地名,即分割为一个单独的条目。

还有一些地名,既没有单独成段,也没有在某个地名后用“○”标示出来,但仍是一个独立条目。这样的情况适用于:

(3)在某个段落中间,无任何符号标记但有语句提示。一般而言,在一个地名叙述结束之后,开始另一个地名的叙述,虽无符号标记,但有标志性文字“又”,这也作为一个地名条目提取出来。如《纪要·福建二》“甘蔗洲”条下文字为

府西北二十五里,横亘江心。居民皆种蔗为业,税课甚丰。又芹洲,在府西南,泽苗江西岸。湍流迅急,壅而成洲,周迴二十馀里,居人隐然圜諲。洲多产芹,故名。又名瀛洲,以其四面有水如瀛洲也。○投桃洲,在府东南马头江中。其形如桃,上有田数千亩。

按照本文制定的前两个条目鉴别与分割方案,“甘蔗洲”提取为一条地名记录,“投桃洲”前有“○”标记,也提取为一条记录。而“芹洲”虽不符合上述两条规定,但它与“甘蔗洲”并没有逻辑上的隶属关系或并列关系,仅仅是因为得名原因相同:甘蔗洲之名是因为洲上居民皆种甘蔗为业,而芹洲得名是因为“洲多产芹”,才放在同一段落中。因此,“芹洲”也提取为一条记录。观察“芹洲”词条的特点,虽无任何符号标记,但有标志性文字“又”。据此,我们认定在段落中某个句号之后,以“又”字开启的另段内容为一新条目。

以上三种分割原则,因为都有某种标志性符号或文字,因此判定一个地名条目十分容易,可实现自动提取。但有的地名,附在记载某个地名的段落里,其前既无“○”标志,又无“又”字这样标志性文字,但从内容判断,仍能看出这是一个单独的地名,因此本文也单独提取为一条地名记录。这适用于:

(4)需要根据实际内容判别是否进行条目分割,如:

青城 有二:一在南薰门外,宋祭天斋宫也,谓之南青城;封丘门外又有北青城,宋祭地斋宫也。靖康末金人复围汴,斡离不自真定趣汴,至城下,屯于城东刘家寺,粘没喝自河阳趣汴,屯于青城,既而金人入青城,攻朝阳门;又绍定六年蒙古速不台攻汴,至青城,金叛将崔立以汴京降,尽送后妃诸王于青城;皆南青城也。(《纪要·河南二》)

尽管“青城”是一个条目,但其后的文字是分别叙述的南青城和北青城,两个青城只是位置接近,但两座城是独立的,是宋朝分别在两个地点修筑的两个宫发展而来。因此青城提取出两个地名条目:南青城和北青城,而不提取“青城”这样一个地名条目。观察该段文字的行文特点,其前有“有二”这样标志性文字,再观察其他有这两个字的记录,发现并不是所有带“有二”字样的内容都可以提取出两条独立的地名记录,还要根据具体情况进行分析。例如掣水河的情况就不同于青城。“掣水河”下的内容为:

有二:一在城南戴楼门外,东流;一在城东扬州门外,南流;俱至城东南二十里入汴河。明朝洪武中黄河决溢,疏凿二河以分泄之,因名。(《纪要·河南二》)

虽然也是“有二”,但这二条河流都没单独的名字,并且最后注入同一条河流,因此只提取“掣水河”一条记录,其两条河道都是“掣水河”的组成部分。其他一些不能通过特殊文字区分的条目,也须根据这一原则进行具体分析,然后决定如何进行条目分割。其他没有标志性文字的地名,也都需要根据具体内容进行判断,人工提取地名条目。

根据以上四个原则,本文对《纪要》中所涉及的3万多地名全部进行了拆分。拆分之后,录入我们设计的“正史地理信息系统”。条目添加完成,还可对条目信息进行编辑与修改。

二、地名所属行政系统的确定

明代三司分治,都指挥使司、布政使司、按察使司分掌地方军事、行政、监察之权。三司中以布政使司及下辖的府州县为明代正式的地方行政区划。而都司卫所除“总方面之兵”外,也兼有行政区划意义,可称之为“军管型政区”,尤其在实土、准实土的都司、行都司、卫、所方面表现更为突出,是极具特色的非正式政区(按察使司无行政区划意义,兹不论)[2]。为明确表达明代政区的这一特点,也为了方便在以后的工作中对不同类型的地名进行统计分析,笔者需要确定地名所属的行政系统,于是按照地名所属系统的不同,将其分为两类:普通行政系统地名(简称行政系统地名)与军管型行政系统地名(简称军事系统地名)①在周振鹤主编,郭红、靳润成所著《中国行政区划通史·明代卷》中,实际的政区划分即以此为标准将明代政区分为两种类型。两类。前者指十五省及其所统辖的府州县,后者指都指挥使司及下辖的所有卫所州县,而具体何种地名归入行政系统,何种地名归入军事系统,则以图1为依据。根据隶属关系及地名通名即可准确判断出一个地名实体所属的行政系统。根据图1的划分原则,凡是辖于府、州的地名,均属于行政系统,凡辖于都司、留守司的卫、所、州、县,均属于军事系统,这一原则简单易行,同时也避免了对西南地区的特殊建置如军民府、宣慰使司、宣抚司等这些带有军事色彩的地名在系统划分时的问题:由于这些建置均辖于行政系统中的府,故划入行政系统。另外,军镇虽不是正式行政区划单位,但由于其军政一体化的特点[3],本文将之归入军事系统中,认为也是某一级政区名,在类型上属于军事系统。

三、地名隶属关系与地名等级的确定

地名所属系统明确之后要考虑的是地名隶属关系与地名等级的确定。首先,按照是否为政区名,本文把地名分为两类:政区地名与非政区地名。政区地名,既包括府、州、县等行政系统中代表不同行政区划层级的地名,也包括都司、军民指挥使司、卫、所等军事系统中等级最高与布政使司相当,最低与县相当的具有行政区划意义的地名。非政区地名,即县以下所有聚落、山川、亭台、驿站、陵墓、馆所、池沼等所有没有政区意义的地名。毫无疑问,每个非政区地名都隶属于某个层级的政区地名并且非政区地名没有等级之分,而政区地名则居于不同的等级。《纪要》在每个省的第一卷,都列举出了该省所有行政系统的政区地名,按照这一列表即可找到所有行政系统地名。军事系统地名均附在《附见》中,从通名即可判断其是否为政区地名。其次,对于政区地名要确定其相互之间的隶属关系。《纪要》的文字记载虽然眉目清楚,但并不能仅从文字的位置特点判断出地名的隶属关系。因此需要结合《纪要》原文及图1,来确定每个地名所代表的政区实体的隶属关系。《纪要》中每省的首卷对行政系统中政区地名的隶属关系都有详细说明,因此,根据这一说明及图1的层级关系,即可确定行政系统中政区地名的隶属关系。而军事系统中的行政区划由于是非正式的,这类地名在图中并没有说明其隶属关系,但可根据其通名及《纪要》正文中的记述来判断(文中提到的少数民族政区及其他国家,暂时以附录形式保存)。建立隶属关系的方法为:按照从高到低的顺序依次选择该政区的上级政区,直到该政区本身为止;如果该政区为最高一级,则其上级政区为空。同时,拆分出政区地名的专名与通名。最后,对该政区的文字描述全部保留,以备继续工作之用。

地名等级与地名之间的隶属关系,既相联系又有相对独立性。一般来讲,等级低的政区都隶属于等级高的政区,但隶属于二级政区的未必就一定是三级政区。如属府的县与属州(指属府的州)的县,都是四级,前者不会因为直接隶属于府就比后者高出一级而变为三级。因此,明确了隶属关系,还需要划定每个地名实体的等级。根据明代政区特点及《纪要》的记载,本文进行如下划分:一级政区为行政系统中的两京十三布政使司,二级政区为行政系统中的府、直隶州和军事系统中的都司、行都司、留守司,三级政区为行政系统中属府的州与军事系统中的司、卫、所,四级政区为行政系统中的县与军事系统中隶属于三级政区的千户所、州及军民司所辖县,五级政区为军事系统中的守御百户所(见图1)①明代政区的层级,谭其骧主编的《中国历史地图集》受纸质地图的限制,没有对属府的州进行范围表达,以致无法区分属府的州所管辖的县与府直接管辖的县。本文设计的GIS系统是电子格式,因此在表达上较少受到媒介的干扰。[4]。此外,还有两种特殊政区,没有包括在图1中。一为军镇,明朝的军镇虽不是一级实体政区,但由于《纪要》浓厚的军事色彩,军镇在陕西省约占1/5的篇幅,且这些军镇有军政一体化的特点,从《纪要》文字来看,它显然与府同级,因而遵照《纪要》原文,将之定为二级。二为西南地区因地制宜设置的军民府、长官司等。本文根据其上下隶属关系,将军民府、宣慰使司、宣抚司划入二级,安抚司为三级,长官司为四级。这样,所有政区地名就构成了一个层级关系清晰、等级明确的系统。由于不同等级地名隶属关系的不确定性,在标出地名等级的同时,还须标明其上级地名及下级地名,这在明确隶属关系的同时,也避免了异地同名问题带来的困扰。

图1 中国明代行政隶属关系图

四、非政区地名的等级与类型划分

非政区地名是最基础的地名,同时数量比政区地名大得多(《纪要》中的3万多地名70%以上是非政区地名),因此它虽无行政区划意义上的等级层次之分,但也类型各异、规模悬殊、军事地位不同。《纪要》是一本军事色彩甚为浓厚的著作,为体现《纪要》一书的写作特色,突出非政区地名在全省乃至全国的军事地位,我们对非政区地名也作出了分级。根据原文观点并按照规模大小及位置的重要程度,将之划分为三个等级:第一级,在全国占有重要地位的非政区地名,凡在卷一三〇列出词条的地名,全部划入;第二级,在每省的首卷标明“名山”“大川”“重险”字样的山川关隘,全部列入;第三级则为其他所有非政区地名。

非政区地名类型的划分,笔者参考储亚平等人根据通名分类的方法[5],首先要进行通名的判别。按照崔恒生著《古今地理通名汇释》[6](以下简称《汇释》)中的规范来判别,凡是《汇释》中收录的通名,本文统一参照《汇释》提取出通名;《汇释》中没有收录的,则依据其具体含义判定是否提取通名。例如,《纪要》中经常出现的废县、故县,在《汇释》中有收录,故据此列为通名。但“废城”“故城”“故××城”之类,《汇释》中未予收录,但这类地名数量与前者废县、故县等不相上下,故依照此例,将其通名提取为“废城”“故城”(“故××城”亦然)。有的地名,通名与专名合而为一,如“海”这个地名只有一个字,我们处理的方法是:“海”在提取通名的同时,亦将之作为专名提取。

根据已经提取的通名,参考上述储安平等人的分类方法,笔者认为第一次分类不宜划分过细,因此先将《纪要》中所有非政区地名划分为三类:山脉类地名,包括所有与山相关的地名实体,如山脉、丘陵、岩石、峰谷等起伏较大的地貌;“水系(包括海域)类地名”,如河流、海洋、瀑布、湖泊、池塘、沼泽等;“其他地理实体地名”,既包括所有人文地理实体地名,如聚落、建筑、道路、关隘等,也包括其他地物和自然地理实体地名,如山洞、树木、较小岩石等。

若通名有多重意义,则要根据上下文内容来进行类型划分。如“固”,这个词本身就包含四种含义:(1)险要之地;(2)指岛屿;(3)指葬所;(4)用为聚落通名。因此,地名虽同为“固”,但依据其不同的含义,可能归入山脉类(险要之地)或水系类(岛屿)或其他地理实体地名类(葬所、聚落)。例如,“石泉固”条下文字为:

在县西北。《水经注》:“固在众山之内,平川之中,四周绝涧,阻水八丈,有余石高五丈,石上赤土又高一丈,四壁直立,广四十五步,路不容轨,仅通人马,谓之石泉固。”《一统志》“县西北有石泉城”,即此也。(《纪要·北直三》)

据该段文字可判断此“石泉固”为险要之地,不是人工修造,且地势崎岖,故列入山脉类地名。再如“曹公固”条下文字为:

县东南二里。旧《志》云:汉青州刺史隽不疑冢也。高五丈有奇。曹操攻袁谭,因冢为固,因名。(《纪要·北直四》)

可见此“固”为葬所,应归入“其他地理实体”类。

有的地名,根据上下文仍无法确定其具体类别,本文也暂时归入“其他地理实体”类。如“塘”,通常的含义为水系的某一种形态,但有时也指砾滩或草滩,也可用为驿站名与聚落通名,在方言中也指古纤道,还是古代计量路程的单位(陆路10里为1塘,水路15里为1塘),明清时期驻军警备的较小关卡也叫做塘,等等。因此,仅凭一个通名,很难判断该地名实体到底属于哪一类。只能从文字入手,具体分析。如倪塘:

倪塘 在上元县东南二十五里。王敦使王含、钱凤逼建康,败于越城,含率余党于倪塘西置五城,如却月势。又隆安二年,王恭复叛,斩于倪塘。梁敬帝时,齐兵至秣陵故治,自方山进至倪塘,陈霸先拒之于白城。《金陵记》:“建康在六朝时西至石头,东至倪塘,南至石子冈,北过蒋山,相距各四十里,户凡二十八万。侯景之乱至于陈,时中外人物,不及宋、齐之半。”胡氏曰:“倪塘,倪氏所筑塘也,在建康东北方山埭南。”似误。(《纪要·南直2》)

文中四件关于倪塘的事,都与某个事件相关,而没有任何与水体相关的描述,也没有明确表示该地名实体为山脉类,因此本文虽然还是无法判断其究竟属于哪一类地名,但可以判断出其必定可划入“其他地理实体”类。

进行以上分割之后,即可把非政区地名录入数据库。录入完成之后,该地名数据库的初步建设即告完成。

通过对《纪要》的文字分析,笔者探索了对《纪要》地名进行初步解析与分类的方法,并研究了如何对其相互之间的关系进行判断。为完成这些工作,笔者提出了相应的原则与方法,即为构建历史GIS数据库要解决的四个首要问题。要研究地名,就需要识别,即提取出地名。《纪要》对地名的叙述,既有普遍性又有特殊性。首先,按照地名等级逐一对地名进行叙述,是历史地理古籍常用的一种方式。但《纪要》容纳的地名数量较多,因此采用了在一个地名后附入一个或多个地名的写作方式,本文阐述的第一个问题就是将这些地名一一提取出来。其次,每个朝代的行政区划都有其特点,具体到明代,主要表现为军事系统的实土化。这样,我们在划分地名层级关系之前,就要考虑地名所属的系统,这也是与其他朝代不同的。地名的隶属关系与等级是做任何地名解析工作时都面临的问题,笔者提出了地名隶属关系划分的原则与方法,分析了它与地名等级的关系,提出了等级划分方案。非政区地名一般没有等级之分,但笔者为突出《纪要》的写作特点,将其按照规模大小等因素划分了等级。在分类中,由于是第一次分类,故划分的类型较少,以后随着工作的展开,将逐步划分出更为细致的类别。笔者认为,这些问题是建立以历史地理古籍为基础的历史GIS地名数据库所要解决的首要问题。只有解决了这些问题,后续的工作,如地名定位,与现代地图耦合,附入与该地名有关的历史事件、人物,等等,才得以相继展开。

此项工作可为其他历史地理古籍地名的提取方法及地名关系的构建提供一些参考。我国正史中有16部有地理志,还有多部全国地理总志,虽然这些古籍体例不尽相同,但大都像《纪要》这样,以全国最高行政区划为纲,逐一叙述其下各级政区的设置,最后及于非政区地名。因此,这些古籍地名的解析,基本都可在本文提出的原则基础上稍加改易来考虑地名的初步解析与关系构建。

[1] 梁启超.中国近三百年学术史[M].北京:东方出版社,2004:107.

[2] 靳润成.中国行政区划通史(明代卷)[M].上海:复旦大学出版社,2007:259.

[3] 赵现海.明代九边军镇体制研究 [D].长春:东北师范大学,2005:241.

[4] 谭其骧.中国历史地图集(明时期图组)[M].北京:中国地图出版社,1982.

[5] 储亚平,尹钧科,孙东虎.地名学基础教程[M].北京:中国地图出版社,1994:80-81.

[6] 崔恒昇.中国古今地理通名汇释 [M].合肥:黄山书社,2003.

猜你喜欢
政区青城条目
江苏省政区图
青城秋色
我爱家乡青城美
咏青城
《词诠》互见条目述略
江苏省政区图
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
青城道味
隋唐之际王世充郑国政区管窥
论清季民元之际政区的改革