徽州契约文书地域信息组织与揭示的路径探究

2018-06-28 10:35王昕张洁汤萌
新世纪图书馆 2018年4期
关键词:上海交通大学徽州

王昕?张洁?汤萌

摘 要 上海交通大学图书馆在新藏徽州府内六县的契约文书数字化与编目的基础上,实践性地探索地域信息组织与揭示新路径,为实现契约文书组织和揭示研究提供了新思路和标准化操作方式。

关键词 契约文书 徽州 上海交通大学

分类号 G254

DOI 10.16810/j.cnki.1672-514X.2018.04.012

Abstract On the basis of digitizing and cataloging the new collected deed documents of six counties in Huizhou, Shanghai Jiao Tong University Library explores the geographical information organization and reveals a new path to provide new ideas and methods to achieve standardization of deed documents reveal and organization.

Keywords Deed document. Huizhou. Shanghai Jiao Tong University.

0 引言

近十年来,地方历史文献的发现、收藏数量呈井喷态势,其中古徽州地区文献被誉为是“继甲骨文字、汉晋简帛、敦煌文书、明清档案之后中国文献史上第五大发现”[1]。因此,地方历史文献对于文化保存与学术研究所具有的重要性可见一斑。契约文书因具备鲜明的地方性、民间性、时代性和真实性,成为地方文献中的一类特种文献。历史学者越来越重视对地域和社会组织方面的研究,强调文献史料所处的地域情境和社会组织关系[2]。图书馆作为收藏地方历史文献的重要机构之一,承担着对文献开展数字化和信息组织的建设任务,围绕契约文书等相关地方历史文献开展的数字化资源组织揭示研究将有利于辅助数字化时代历史学学术科研的进展。

1 契约文书文献特点分析

1.1 研究对文献组织揭示的需求

契约文书是民间地方歷史文献中重要的组成部分,作为民间社会在各种活动中直接产生的原始文字资料,具有原始性、惟一性及文物性质[3]。史学研究者可以从中挖掘民间历史记忆,还原活生生的、丰富多彩的民间社会生活,主要因素有:

(1) 契约文书中涉及买卖、租赁或分家等多种民间交易活动,深入细致地研究有利于全面还原民间社会经济发展全景。

(2) 契约文书归户性和地域特征包含丰富的行政地域信息,图书馆界可以通过对文献时空维度的组织揭示为研究者提供有价值的潜在学术研究线索。

基于以上两点原因,整理者和研究者都意识到原有史学研究对地域和社会组织方面的差异重视程度不够,没有强调地域信息对描述契约文书这类文献时所起到的作用[2]。开始注重对文献以家族为单位进行分类整理,以体现某个姓氏家族在特定居住地域内生活和生产方面的研究[4]。但是,仅依靠现代文献分类体系无法精准描述契约文书内涵、时间和空间方面的信息特征。而且这些问题都是图书馆界和史学界对契约文书进行信息组织与揭示研究中所面临的新挑战。

因此,笔者的研究视角聚焦在空间维度上系统性、规范化地组织、描述和揭示契约文书,形成科学系统的契约文书地域信息组织结构和揭示方法。

1.2 关键问题分析

描述性元数据是图书馆领域用以组织揭示文献资源的技术工具。通过描述文献资源的内容、范围、权限等信息,在文献资源与用户之间构建起使用的桥梁。通过元数据对文献进行资源描述、组织和揭示,实现资源的发现、识别、选择和获取,并提供资源互操作的途径。

目前,国内新疆地方古籍文献、敦煌文书、徽州文书、清水江文书等多个地方文献组织揭示研究项目已完成或正在进行文献资料数据库的建设工作[5-8],均采用自建一般元数据方案进行资源组织[9-11]。但是,仅依靠书目数据或一般元数据的方式对文献进行组织已不能全面深入地展示资源内容。国际上一些主要的数字图书馆建设项目都设计了相应的元数据标准指导资源揭示工作,但尚无针对类似契约文书资源的描述元数据规范。例如,美国国会图书馆的PREMIS侧重资源数字化长期保存规范的数据模型[12],但是对历史文献类资源互操作仍缺乏完整地规范性操作指导。我国的《专门数字对象描述元数据规范》 和国家数字图书馆工程标准规范项目研究成果中,地方历史文献的元数据规范均未列入专门元数据规范中。

国内多家学术机构已经明确意识到契约文书描述、组织和揭示工作的特殊性,并先后从多个角度开展相关研究。中山大学图书馆从著录规范的角度论证时间项、地点项和归户项等对组织揭示文书的重要意义[13]。黄山学院从标识、内容、物理外观三个方面定义并设计徽州文书元数据[14]。闽都文献多维度标引[15]和台湾古契约文书数据库等项目以特色地方文献的标引和数据库建设工作为重点展开研究。

国内收藏契约文书的图书馆或档案馆等机构逐步进入对资源进行数字化整理的实践性研究阶段,包括科学有序地整理、分类和加工建设工作。吴佩林分析国内地方文献整理与数字化工作现状,认为文献编目未完全体现资料内在连贯性和整体性是主要存在问题之一,而且大多采取自行制定元数据的方案来完成资源组织与描述[16]。

成千上万件杂乱的契约文书将增加用户使用的困难,只有经过有序组织才能帮助用户使用契约文书,梳理出研究脉络与线索。结合契约文书文献特征以及研究需求,笔者认为对契约文书的地域信息进行有序地、科学地、规范地组织描述和揭示是解决此类地方历史文献组织的重要研究方向之一。

1.3 地域信息描述与提取途径

史学研究者已普遍认为将文献史料融入当时社区情境是学术界普遍认同的有效研究视角,因此特别希望整理挖掘中国近代村落、土地以及社群之间的关系时能从文献中获取更多情境式的线索[17]。契约文书中交易发生所在地域的分布统计与呈现既有助于读者从总体上把握文献的分布和存量,也将提升数据库的分析功能从而帮助人们发现不同批次文献之间的联系。以上学术研究需求的新趋势成为契约文书元数据方案特征归纳的新要求。

契约文书元数据方案不仅要体现一般元数据规范应具备的描述、发现、识别资源对象等的基础功能,还要体现出内容性、物理描述和识别特征。上海交通大学图书馆分类整理馆藏的契约文书文献后,研究制定了20个字段的元数据方案,包括类型、标识符、档案号、附注、页数、尺寸、材质、名称、事主、归户、标的、事由等信息。此元数据方案能实现年代、人名、类型、来源等多维度检索和分析。深入分析归纳元数据方案,归纳出契约文书元数据信息提取的三类特征,图1是契约文书内容特征、物理特征和身份识别特征中具体描述和提取方案。

(1) 内容特征。主要用来描述文书中涉及交易的事主和交易标的物。标的物中有大量的包含地域信息的内容特征,如房屋坐落地、土地字号、山、果林等。此外,契约交易发生地理包含重要行政地域信息。

(2) 物理特征。物理特征主要用来描述文书的外形,包括页数、尺寸、材质等信息。

(3) 身份识别特征。身份特征主要指文书本身的唯一识别符,这是用来标识文书的重要信息。

为了充分挖掘文献在研究情境方面的突出价值,描述、组织并揭示地域信息,可以通过数字人文的手段实现契约文书中的地域信息关联、组织与可视化[18]。实现前提是对契约文书文献中蕴藏的地域信息进行细致的分析,揭示其科学规律和规范。

因此,研究提出以立体层级关系的地域结构来组织契约文书中与地域相关的信息,特别是交易地发生的地域信息,结合归户信息和时间维度对契约文书进行全景式的组织与深度揭示。下面将重点阐述具体研究思路及实现过程。

2 地域信息组织与揭示的实现

地域信息组织与揭示的实现过程中,首先探索并设计适用于历史文献类型数据库的标准化地域信息元数据组织方案,建立地域信息组织的层级结构和提取流程,并选择了约5.6万件的契约文书文献进行实例分析,延伸出文书中地域元素可视化等数字人文功能,为史学研究者开展契约文书的深入研究提供支撑。

2.1 地域信息的组织

2.1.1 地域信息组织的特征分析

结合图书馆学、档案学的文献研究方法和知识组织方法,遵照契约文书的特征,从文书的产生脉络及文书实际记载内容出发,建立适用于数据库的契约文书地域信息的知识组织体系。基于契约文书的特性,研究设计名称、归户、地域、时间和时间(公历)等字段反映资料的多维度,其中,分析大量的契约文书后可知地域信息的特征字符以县、都、图为显著特征字符。表1统计总结了契约文书名称、归户、地域和时间等字段中的特征词。

2.1.2 地域信息组织的层级结构

契约文书元数据中地域字段蕴含了主要的地域相关信息,归户和描述两个字段中也分别包含部分地域细节信息。比较三个字段所包含的具体地域特征,契约文书地域字段的内容相对复杂,主要体现在地域行政区域的层级结构。

由于大部分契约文书处于明清时期,所以设计地域信息组织的层级结构需要着重考虑明清时期中国行政区划特点。而当时中国行政区域划分原则是以省、县、都、图和村的体系结构。因此,研究设计了“省—县—都—图—村”五级层级结构,(如图2所示)。在具体设计的过程中,还参考了地方志地理信息系统的构建思路和具体实现方法[19]。契约文书信息组织层级结构设计考虑了标准化、兼容性、求同性与扩展性等原则,使得研究者可以利用这一层次结构实现多维文献地理信息关联聚类。

在实例研究的过程中,笔者根据契约文书文献特点的标准化地域信息元数据方案,建立起古徽州地区地域信息的五层结构体系。地域信息标准化层级体系结构的建立有利于整合契约文书元数据中地域信息,为地域信息著录、提取或转换提供规范性的理论依据。经过对地域信息的层级化梳理后,有助于提升数据内容辨识度,以便立体多维的描述和可视化契约文书地域信息。下面的研究将围绕如何对已编目的文书元数据内容进行标准化的提取与转化展开。

2.2 地域信息的提取流程

完成契约文书中地域信息组织特征分析和层级结构设计后,研究将进一步对地域信息进行提取方案的研究。具体对契约文书中地域信息提取的应用流程如图3所示。

(1) 截词分析。根据契约文书名称、归户、地域和时间等字段中的特征词,运用程序截词和人工干预的双重方式完成特征字符的截词工作。

(2) 特征分析。根據契约文书名称、归户、地域和时间等字段中的特征词,特别是地域信息特征词“县、都、图”等,进行地域信息的聚合分析。

(3) 信息展示。通过时间、地域和归户等维度做出契约文献的信息可视化展示。

以古徽州地域信息特征为例,主要的分词或截词判断原则是“府”“县”“都”“图”和“村”。通过分词程序以古徽州地域信息特征进行分词或截词判断原则,提取出标准化的地域信息。必要时,可以由编目专家进行人工干预,详细解读契约文书中的内容,结合研究需求及文书特点,判断固定位置、关键词、前后缀词等方法寻找地域信息,提取后填入设计好的元数据字段中。经过分词程序和人工干预的双重机制,可以基本确保标准化的地域信息被有效提取。

古徽州所属区域包括现安徽歙县、休宁、祁门、黟县、绩溪和江西婺源等6个县,在近代中国历史上古徽州地区有着相当繁荣的商业经济生活,选取这一地区的文献作为研究对象既有学术价值又具备推广意义。上海交通大学图书馆新藏古徽州地区文献中已完成数字化文书数量达到5.6万件,这些文献完成了契约的归户性、事主、事由、标的物和地域信息的基本编目标引。因此,这批文献的前期数字化相关工作为后续的实例分析打下了扎实的研究基础。

2.3 研究实例分析

研究实例主要来自上海交通大学图书馆馆藏徽州歙县区域的文书,这些文书经过数字化和编目工作,完成了对文书日期、名称、事主和归户信息的组织工作,如表2所示。这些元数据信息的基本组织工作可以梳理出文献史料所处的情境,借助本文研究提出的地域层级结构有利于进一步深入还原整个文献史料在时间、空间、内容和归户等方面的真实情境。

因此,在馆藏徽州契约文书基础上,根据地域信息层级结构并按照地域信息提取流程进行实证分析研究。

2 顺治六年二月

初四日 1649 顺治六年吳三□立契 吳三□(立契人);□□千(中見人);方□□(中見人);吳灶□(代筆人);

(吳)社明(兄,買人) 安徽省歙縣三十三都五圖方氏

3 乾隆四十一年十月 1776 乾隆四十一年僉業票 方玄正(業戶);

方兆和(經承) 安徽省徽州府歙縣三十三都三圖二甲方氏

4 乾隆二十四年十二月 1759 乾隆二十四年吊票 程□(戶名);

方聖先(受稅人);

鮑岩□(册里) 安徽省徽州府歙縣三十三都三圖二甲方氏

2.3.1 截词分析

按照前文表1和图1的原则进行截词分析并按地域层级结构进行特征符提取,运行提取程序的部分结果实例如表3所示。

通过这样的数据分析,可以全面概括出古徽州所辖六个县,及县辖各都,图内的文献规模和内容特征。研究还对截词分析程序的运行效果进行分析。以歙县地区文书为例,截词分析程序有效处理的文书比例为98%,仅2%的文书需要编目专家人工干预确定具体地域信息的准确性。另外,在此基础上进行契约文书的时间特征或内容特征的信息截词分析。

2.3.2 特征分析

截词分析过程中,程序标准化提取出文书中省、县、都、图(村)等地域信息。特征分析过程中,以县为单位对各个县所辖的都进行组织与整合。以清乾隆三十六年刊本《歙县志》为例,卷一《都鄙》中记载了歙县当时的都、图、村信息,共计37个都。而馆藏的歙县各都地域文献分析后发现,37个都各自有一定数量的文书。按照地域信息层级结构的逐级推进,研究还深入到选取各都中文书数量最多的三个都(33、35、37都)进行时间(年代)维度和地域维度的交叉组织(如图4所示)。

2.3.3 信息展示

依照地域信息的层级结构提取出整个徽州地区的文书内容,清晰形象地揭示并掌握文书总体规模。图5是对馆藏古徽州文献完成地域特征符标准化提取后,制作生成的古徽州一府六县文书规模的可视化图。馆藏契约文书经过实证检验后,验证了研究提出的地域层级结构和地域信息提取流程的有效与可行。

3 总结与展望

契约文书在地方历史文献中占据重要比例,但这些珍贵的史料文献尚未全面系统地揭示和充分利用。数字化时代契约文书的深度聚合与揭示的研究工作具有相当重要的学术意义。图书馆从事地方文献的搜集、典藏、整理和数字化工作必将是数字人文时代社科研究的大势所趋[20]。

本文重点聚焦契约文书地域性研究,探索契约文书地域信息标准化描述、抽取、组织和揭示的实现路径,提出契约文书地域信息层级组织结构。以上海交通大学图书馆新藏古徽州契约文书为研究对象,开展契约文书地域信息组织与揭示新路径的探索研究,期望满足当代史学学者研究过程中对文献资源深度聚合与展示的数字人文需求[21]。下一步工作会,将本文的研究成果深入推广并运用到契约文书数据库功能改善中,实现资源关联、聚合和可视化效果并丰富契约文书地理信息系统功能。

猜你喜欢
上海交通大学徽州
无梦到徽州
中外大学教师教学发展中心比较
直面现实的高校国保单位保护管理工作机制转型
徽州人
我国高校微博传播力影响因素探析及对策
Chinese Perch:Dream Beauty Portrayedin Art, Poetry
徽州贡菊开采
The Beauty of Painting in English Writing
走徽州
盛名里的徽州茶