科技类图书数字化出版新实践探析

2022-04-14 13:24刘云龙
新闻研究导刊 2022年2期
关键词:出版数字化

摘要:随着互联网技术、信息技术、大数据技术、人工智能技术的发展与普及,数字化出版成为出版机构的重要工作方向。以传统纸质出版为主的专业型出版社在数字化出版方面尚处于探索阶段,还有较大发展空间。《中国矿产地质志》作为入选国家出版基金资助的重点出版图书,在数字化方面作出了新的尝试。《中国矿产地质志》的数字化采取了独特的建设思路和新颖的结构方案,对25卷志书的全部内容进行了深度的数字化加工,对不同类型内容进行分类、分级并加以属性标引,还构建了统一资源的数字化平台,保证了数字化建设的准确性、可持续性和可拓展性等,为读者提供了在线阅读、信息查询、读者反馈等丰富的知识内容服务。文章以《中国矿产地质志》的数字化为例,探索科技类图书数字化出版的实践。

关键词:科技图书;数字化;出版;《中国矿产地质志》

中图分类号:G230.7 文献标志码:A 文章编号:1674-8883(2022)02-0188-03

一、科技类图书数字化发展现状

随着科学技术的日益发展,融媒体、VR、AR、5G、AI等的出现,给传统出版社带来了巨大的挑战,纸质出版已经难以满足读者对知识服务的迫切需求,促使出版社迈向数字出版、融合发展的新阶段[1]。在此过程中,专业型出版社拥有大量科技类图书,内容储备丰富,但是数字化较薄弱,数字出版工作面临瓶颈。这其中,医学教材类图书数字化建设成绩较为突出,形成了在线电子书、网络课件、模拟软件等一系列数字化产品。但总体而言,科技类图书的数字化依然处于发展初级阶段,有待更大的突破和发展[2-3]。

《中国矿产地质志》是地质出版社近期出版的重点图书,其中第一批25卷已成功获批为国家出版基金的资助项目。在此基础上开展了《中国矿产地质志》的数字化建设,并规划了全新的数字化建设模式,以期开辟科技类图书数字化的新思路。

二、《中国矿产地质志》出版概况

矿产资源是关乎国家经济命脉的重要物质基础,也是稳定经济社会发展和保障群众生活的必要物质条件[4]。在此背景下,地质出版社组织大量专家学者编撰出版了《中国矿产地质志》系列志书,该志书是中华人民共和国成立以来第一部系统总结全国矿产地质状况及重要矿产的成矿规律的重大系列志书,为全国各省(自治区、直辖市)政府和各级相关部门作出矿产资源的规划、决策、部署提供了全面参考和重要依据;为全国人民了解祖国大地矿产资源的现状及开发利用前景提供了权威的书籍;为从事矿产资源勘查、开发以及科学研究和地矿教育的从业人员及相关大中院校的师生提供了丰富的资料。

《中国矿产地质志》篇幅巨大,丛书总卷数预计可达150余卷,包括全国志、单矿种志、省志、省级重要矿种志、区带志、专题志、科学普及本,共七系列。其中《中国矿产地质志》第一批25卷获得国家出版基金资助,在此基础上开始了对《中国矿产地质志》的数字化工作。巨大的内容储量和较长的出版周期决定了对其的数字化建设需要具有更深入的角度以及更长远的规划。

三、《中国矿产地质志》数字化出版的总体设计

在参考了常见的科技类图书的数字化方式后[5-6],出版社决定《中国矿产地质志》数字化是以提供“知识云服务”为目标,建设集在线阅读、信息查询、书讯投递、新闻展示、读者反馈等功能为一体的数字化平台。数字化建设主要从两个方面开展,一方面是针对图书内容开展深度数字化加工,针对不同类型内容分别进行加工,形成多维综合数据库;另一方面是按照“准确、便利、可扩展、易维护”的思路同步搭建数字平台。

(一)图书资源数字化

图书资源数字化是数字出版的重要基础,其形成的多维数字化资源是数字平台丰富功能得以实现的前提,通过对不同性质内容进行分类、分级,再根据功能需求进行多维度标引。数字化加工后的图书,被拆分成大量知识条目数据,对接平台后可方便读者查询和检索资料,便于用户提取知识。

在此前提下,根据读者的阅读需求和习惯,按照统一的规范和标准对《中国矿产地质志》25卷图书的资源进行数字化加工,并根据内容的不同类型,数字化后的资源包括以下不同格式的文件,如XML文档、PDF文件、JPG文件,GIF文件、EPUB文件等。

1.XML文件夹

采用XML格式,并满足XML1.0及以上版本规范,编码方式采用UTF8。每个在文档中出现的元素都必须包含数据内容,不包含数据内容的元素不能出现。对于一些特殊字符,使用转义字符进行表示。在数字化中要保持以下三个原则:

(1)格式正确。包括英文字符的大小和公式、括号的嵌套等。

(2)规范、可读性强。数字化后的文字内容形式应符合阅读规范及段落结构,段首缩进、空格、注释等元素,与纸质图书保持一致。

(3)文字正确。标引后提取的页码、版权页等XML文字内容应与PDF文件和纸质图书一致,文字及拆分正确无误。

2.PDF文件夹

存放高清或优化后的PDF文档,对应版式阅读功能。在PDF文件中,将图像和文本制作成双层文件,其中文本内容在下层,图像内容在上层。图像采用的文件格式均为JPG、GIF等常用格式文件,精度不小于300~400DPI。同时,制作纯图像形式的单层PDF文件,其图像精度为600~800DPI。为确保所有PDF文件中的所有文字内容能够被数字平台系统正确检索和复制拷貝,其中标点符号及外文、数字等均应采用半角格式输出。

3.EPUB文件夹

存放EPUB2.0或EPUB3.0标准的文件夹。EPUB 文件要求所载文字与纸质图书相比,内容要准确、格式要正确、元数据填写要规范正确。运用标注功能对书中不同类型的内容进行标引,以纸质图书为基准,书中内容按照章节标题、图件、表格、文字内容四大类分别进行内容数字化,其中正文部分的章节标题涵盖有一级至五级标题以及段首标题,不同层级赋予不同的标题参数;图件按照图件的图面内容、图名、图注分类注记;表格按照表名、表格内容、注释分别注记。在对志书内容进行数字化的过程中,保持以下三个原则:

(1)采用通用格式的EPUB 文件,并遵循EPUB文件相应的格式标准。

(2)文字编码要符合UTF-8的标准,文字差错率与纸质图书出版要求一致,应小于万分之一。

(3)数字化后的文字内容应与纸质书一致,内容版式等也应与原书基本吻合。

4.其他文件夹

(1)COVER文件夹:存放图书封面图片的文件夹,对应志书库及图表库封面展示的调用。

(2)IMAGE文件夹:存放图书插图的文件夹,对应图表库图件的调用。图片文件格式可以为 JPG、JPEG、TIF、BMP等通用格式,彩色图像的颜色数不低于 24 位色,灰度图像的灰度级别不低于256级。

(3)表格文件夹:将书中每个单元格作为一个字段,并提取每个单元格中的内容用于检索。

(4)参考文献文件夹:其作为数字化中一个单独条目进行加工。《中国矿产地质志》多采用著者-编年制,对个别采用顺序编码制的参考文献,还须在文中对应的引用文字处添加锚点(anchor),实现正文文字与参考文献的关联(XML:link)。

(5)字符文件夹:字符部分中,在GB18030 字符集以内的全部转化为编码字符,字符集以外的按行内图处理。对于化石、地层等内容出现的生僻字,以及公式、字母组合等是否作为行内图处理的原则和标准——在GB18030字符集内能够正常描述并解析展示的(包括简单公式),统一采用字符;若不能正常描述并解析展示的,才进行行内图处理。

(二)数字平台搭建

数字化平台是数字资源内容得以展现的媒介[7]。《中国矿产地质志》数字平台建立了流媒体阅读、版式阅读、图表汇总库等主要板块,同时辅以查询、展示等其他功能,对系列志书进行全面性、系统性,全内容、多维度的展示,并满足后期提供知识云服务的要求。

考虑到平台系统需要具有展示性、阅读性、辅助性等特点,在此基础上对平台的多模块系统构架建设采用JAVA语言开发,基于J2EE应用平台的解决方案,采用Restful API接口。

在实际建设中,数字平台主要功能可分为“首页”“志书库”“图表库”“搜索查询”“大事记”“联系我们”6大主要板块,“搜索”板块可同时对“志书库”及“图表库”中的内容实现搜索调用,以方便读者查询。

1.首页

首页是《中国矿产地质志》数字平台的展示窗口,通过图片、视频、文字、数据表格等多种形式,对《中国矿产地质志》的体系规模、内容概况、编撰过程、发展历程、未来愿景等进行介绍展示,使读者能迅速全面地了解《中国矿产地质志》的大致情况。具体可分为以下四个栏目:

(1)采用照片滚动栏,将《中国矿产地质志》最新的相关会议现场照片进行展示,为读者展示《中国矿产地质志》强有力的编写、出版队伍。

(2)采用图片滚动栏展示最新出版的《中国矿产地质志》的分册封面,并将封面图片与志书库中各书的阅读界面相链接,用户可直接由此进入阅读最新出版的志书内容。

(3)设置可连续翻动、延伸展示的文本框区域,为读者展示从2015年《中国矿产地质志》立项以来的各个发展阶段的大致情况。

(4)在首页最后,设置视频链接区,将有关《中国矿产地质志》的新闻内容展示在此。

2.志书库

志书库板块是将《中国矿产地质志》图书内容以在线阅读的模式展现给读者,是《中国矿产地质志》数字平台中最基础、最重要的组成部分。为了方便不同读者的阅读习惯,满足快速分章节浏览或整体阅读志书的不同需求,志书库以版式阅读和流式阅读两种方式,将志书内容予以全面展示。其中,版式阅读对接数字化后的PDF文件,流式阅读对接数字化的XML文件,数字资源系统根据自动规则将后台管理员上传的数字图书文件进行分解、拆分、转化。

志书库针对专业读者参考的专业本和针对社会大众阅读的普及本分别进行展示阅读。在志书库主页面中,以“图书封面+图书名称”的方式将数字志书展示给读者,同时左侧的快速检索导读框中也都对专业本和普及本分别进行了书名展示并链接进入各自的阅读界面。

3.圖表库

图表库主要收录了每册志书包含的全部图件及表格,同样也按照专业本和普及本两大系列在图标库主页以“图书封面+图书名称”的方式进行展示,点击进入每本志书后,图表按照在书中的出现次序依次排列展示,点击图表展示图片后,出现各种图表信息,还可利用鼠标滚轮对图表进行放大和缩小。此外,点击图标来源按键,可返回书中对应图表的文字部分,进行上下文阅读。

4.搜索查询

搜索查询功能是数字资源系统的重要栏目,设有全系统搜索功能,搜索范围涵盖了志书库及图表库,读者可以迅速、准确检索到需要的信息。搜索查询功能将读者输入的关键词以同义词、相近词等方式针对志书全书文字内容和图表名称或注释进行检索,检索结果以列表的形式,并采用相关程度从高到低的排序展示给读者,为用户罗列最接近的内容。

5.大事记

大事记部分以时间轴的方式对《中国矿产地质志》自2015年立项以来每年的相关会议及内容进行记述,为读者及用户展示《中国矿产地质志》的出版历程及各卷册相关进度。系统后台程序可对此部分进行自主编辑,可供管理人员自行发布大事记内容。

6.联系我们

此部分为读者展示了出版社的相关信息,并设置了留言框,负责接收读者的反馈意见,便于宣传展示《中国矿产地质志》的出版近况和相关动态。后台程序也可供管理人员根据读者反馈意见对此内容进行编辑、排版。

四、结语

《中国矿产地质志》的数字化工作主要是基于获得国家出版基金资助的第一批25卷志书内容,在对已有内容进行充分挖掘和梳理归纳的基础上,开展深度数字化加工形成数字化资源。《中国矿产地质志》的数字化采取了新的实践方式,构建了统一的数字化资源平台。《中国矿产地质志》的数字化建设,秉承着数字出版是对传统出版的全面继承和充分发扬的精神,使纸质图书出版与数字平台搭建、志书内容数字化三项工作齐头并进。其中,数字平台的搭建和志书内容数字化是数字出版过程中的两大重点工作,这两方面的工作相互联系,又互相制约。建设《中国矿产地质志》数字平台,使得该项目在传统纸质出版的方式外,又开辟了新的应用途径,是对纸质图书的延续和扩展,是对传统科技类图书出版的重要补充和完善,也为后续出版的此系列图书奠定了数字化工作的基础。数字化建设使得《中国矿产地质志》借助数字平台等途径,增加阅读方式,扩展服务渠道,建立新型的“知识云服务”模式,为更多的读者服务。在此意义上,《中国矿产地质志》数字出版模式是对科技类图书数字化工作的新实践,具有一定的参考和借鉴价值。

参考文献:

[1] 陆晟.数字出版技术与编辑出版工作的数字化[J].出版广角,2014(2):66-67.

[2] 徐建梅.新媒体时代科技出版专业编辑的转型[J].新闻研究导刊,2021,12(13):201-203.

[3] 苗杨.学术图书数字化问题探讨[J].出版参考,2012(19):13.

[4] 徐志刚,王岩,陈郑辉,等.中国矿产地质志省级“矿产地质图”和“成矿规律图”的编图思路和编图方法[J].地质学报,2020(1):308-330.

[5] 李瑾.数字化时代下的电子图书设计探索[J].艺术科技,2015,28(7):243.

[6] 吴明红.我国出版集团数字出版平台建设效果研究[J].科技传播,2020,12(24):157-159.

[7] 吴茗,龙伟,肖红.自建数字资源的元数据管理实践及启示:以国家图书馆中文图书数字化资源库为例[J].数字图书馆论坛,2014(3):44-48.

作者简介 刘云龙,硕士,编辑,研究方向:地质学。

猜你喜欢
出版数字化
推动内部审计工作数字化的探究
揭示数字化转型的内在逻辑
数字化起舞
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化对行业影响难言“颠覆”
接龙小说“出版”,开学大家嗨起来!
众筹出版是一种出版创新
民国时期老课本出版略探
玛丽·安·伊万斯小说在中国的出版与接受