“互联网+”思维在图书选题策划中的运用

2017-02-27 22:26姜军
今传媒 2017年1期
关键词:图书市场选题数据挖掘

【摘 要】:“互联网+”时代的到来让各行业发展变得无所不能,且形成了资源融合并用的发展态势。现如今,图书出版市场在用户需求方面不能及时有效满足客户需求,社会经济效益产能下降,正处于求新求变的转折期。本文就基于“互联网+”时代背景下的关键技术融合,探讨基于大数据信息采集和数据挖掘技术辅助下的图书选题策划新方案,证明了“互联网+”思维在当代图书出版市场运作中的有效性。

【关 键 词】:“互联网+”思维;图书选题策划;数据挖掘

【作者简介】:姜军,男,中译出版社社长,副编审,硕士,主要从事编辑学、出版学、融合发展、跨媒体发展研究。

【责编介绍】:思涵,女,今传媒杂志社社长助理,主要从事传媒理论和实践研究。

选题策划一直以来都被视为是图书出版工作的重要源泉及核心,这是因为优秀的选题策划可以深入读者的内心,探寻他们的精神文化需求,也能发挥媒介效应,拓展市场开发路径,对图书知识领域做出全面性的前瞻预测和判断。在“互联网+”概念提出以后,基于数字科学互联网技术的图书选题策划环境与出版环境也发生了巨变。因此,出版社也应该积极调整图书选题策划战略,多多利用“互联网+”配合传统出版技术与选题策划技术来实现全新的企业发展策略,为全媒体时代下的图书选题策划创造新思路、新模式,同时也极力发挥选题策划的立体化、全方位规模,为市场建立图书知识品牌,为选题策划工作增值增效。

一、“互联网+”思维与图书选题策划

1.“互联网+”思维的具体内涵

本文所谈到的“互联网+”思维是基于图书选题策划的互联网科学技术运用,即“互联网+图书选题策划”。图书选题策划是一项贯穿于出版社图书制作始终的内容,随着当代社会对文化知识的需求量变大,图书市场竞争的日趋激烈,出版社也面临着必须革新,创造新业态的局面。因此在图书从组稿、编辑、设计、宣传到销售等一系列流程中融入“互联网+”思维,不但能够提升图书选题策划的效率与创造性,也能提升出版社自身与市场、与它社的沟通能力,进而根据市场发展趋势来第一时间调整图书选题策划蓝图,最大限度地规避市场风险所带来的不必要损失,这也是“互联网+”思维在图书选题策划过程中的价值内涵所在。

2.图书的选题策划

图书选题策划是图书出版前期的重要工作,它是为了达到图书制作的特定目标而制定的相关计划方案。出版社将图书选题策划视为是一项特殊的系统工程,这就是因为它的选题策划过程会贯穿整个图书出版的始终,对出版社全员的业务能力都是一种深度考量。具体来说,图书的选题策划应该被归纳为5个步骤。

步骤1:收集信息。图书选题策划是系统工程,更是创意工作,所以大量的创意信息是不可或缺的。收集信息时,应主要注意所收集信息的用途以及对有价值信息的捕捉。前者所考察的是图书编辑的能力,而后者则强调对图书市场的了解程度。

步驟2:立题。立题,即为图书确立中心思想,并在掌握大量的信息基础上,建立工作实际目标,确立图书选题。立题需要注意三方面:第一,要以出版社的特色来进行定位,争取打造特色品牌并试图闯开市场;第二,在策划大众读物时,应该开放视野,挖掘大众阅读兴趣,找准切入点;第三,一定要把握时代脉搏。

步骤3:市场调查。图书市场调查是选题策划中的重要一环,因为它担负着选题的确定与出版社的投资问题。当选题与投资落实以后,就要开始进入选题工作。选题的根本在于多多调查图书市场、社会各个层面,了解市场中一切与所策划选题图书相关的知识业务领域。同时要了解同行的动态,确立自身竞争优势,打好图书未来销售策略的前期基础。

步骤4:市场定位及生产。当图书选题确定并做好市场调查后就要实施市场定位工作,该工作的重点在于确认市场调查结果,并确定图书的开本、用材以及整体设计风格,然后再根据市场状况为图书设定页码、定价,并根据不同的目标读者来定位市场前期销售计划。

在生产制作层面,则意味着项目投资的正式开始。在这一环节中,出版社要控制的是生产费用以及印刷质量,希望在印刷前将一切质量问题完全解决。

步骤5:营销策划。营销策划也是选题策划的最终环节,它的基本实施步骤有两点。其一,在图书出版前的营销策划,这段时间内要为图书的出版积极造势,以达到一定的宣传效果;其二,在图书出版后的营销策划则主要包含两个层面的工作,首先就是要做好线上线下渠道的图书发行工作,确保没有任何侵权行为发生,并保证图书在最快时间内在最广范围内上架铺货销售;其次就是面向目标读者,引发他们购买行为的图书发行后宣传活动及营销活动,确保图书持续保持稳定的销量。

二、互联网+数据挖掘技术的图书选题策划

1.数据的提取

以国内某图书购物网站为例,它的每一个图书商品页面都涵盖了图书的相关信息框、图书文本属性,可以利用网页信息抽取技术来对网页中的数据进行数据信息挖掘,并最终放入到图书的原信息资源库中,它可以作为随后图书选题策划的元数据来使用。

基于“互联网+”环境,选择网页抓取技术,从图书中抓取图书实体信息与市场需求信息,构建相应的资源库。因此,该图书购物网站的图书元数据提取模拟过程如下:

首先,先提取图书的ISBN号,并为图书信息附加如“按销量排名”“猜你喜欢”等URL标识参数,拼接成为该网站图书的高级搜索URL。

第二,模拟HTTP请求,在html中抽取相关的商品链接,并最终获取该网站图书商品的真实html链接与商品ID。

第三,根据上一步骤而得到html地址,并通过http请求来获得图书商品的具体页面信息,此时利用网页抓取技术抓取图书中的详细数据,可将其作为出版社图书信息的资源库资料。

第四,再根据第二步来获取图书商品的ID,并根据互联网中的图书信息拼接它的图书评价页面URL,抽取用户的评价详情,作为选题策划的市场动态信息数据备用。

2.选题策划的数据挖掘

选题策划的数据挖掘基于两点完成,浅度挖掘和深度挖掘。以某书《投资是一场旅行》为例,以下为它的选题策划数据浅度挖掘与深度挖掘分析。

首先,浅度挖掘会根据所收集的《投资是一场旅行》的元数据与市场数据来进行对比性的市场数据统计分析,并浅度挖掘其内在比较有利的选题策划信息。例如可以在网站直观看到的读者评价、销量等。根据这些信息来为图书选题策划奠定信息资源基础。

其次是深度挖掘。深度挖掘相对复杂,它根据图书的选题策划信息,利用到了贝叶斯算法,并基于大量数据来得出分析结果。贝叶斯算法的整个流程要划分为三大部分。首先是准备阶段,网站系统会根据图书选题策划基本数据来生成相对应的训练数据,也同时为第二部分分类规则提供相应数据参考;第二部分的主要任务则为建模,系统会自动根据客户需求来生成相关的训练数据,并计算其中各个类别的计算数据。在每个被计算的图书信息属性中,都要为图书选题策划信息划分属性类别,并在信息发生的前提下验证信息出现概率,进而建立贝叶斯模型;最后一部分则为分类阶段,系统会自动根据第二部分所建立的贝叶斯模型,对图书选题策划中的样本计算设计概率,进而获得较大的信息分了概率,并推测出图书选题策划样本的属性归类,最后获得选题策划信息。

3.互联网+数据挖掘的图书选题策划设计

(1)需求分析

出版社一定要根据图书市场的发展走势、消费者的现实需求反馈以及媒体的评价、图书应力状况来获取舆情信息。充分利用“互联网+”技术,将各个环节与互联网融为一体,提升数据量,加快数据传输速度,并获取利于选题策划的相关信息。另外,为了满足互联网用户的现实需求,应该在系统设计中满足选题策划需求,基于数据挖掘来将图书的选题策划工作划分为四大模块:图书元数据与市场信息提取模块、图书市场信息管理模块、图书市场信息存儲模块以及数据挖掘模块。采用Jsoup软件进行数据提取分析,并利用Hadoop分布式文件系统来存储和管理大量的图书信息,为以后的选题策划奠定资源基础。基于“互联网+”的数据挖掘图书选题策划图书设计模块整体操作流程图如图1所示。

(2)相关功能设计

这里要利用到Jsoup软件工具对图书选题策划数据进行有效提取与分析,同时基于Hadoop生态系统技术来为图书市场挖掘有效信息,以供选题策划使用。它所涉及的相关功能主要有以下三点。

第一,图书的元数据与市场信息提取。该功能基于互联网HTTP模拟技术完成,可以直接获取图书商品的信息页面,并通过超文本文件分析与处理来去除无用信息,获取相应图书中所存在的市场信息、用户行为信息以及元信息数据等等。对它们的提取有利于出版社的信息数据库建立。

第二,数据挖掘模块。如上文提到,它被分为深度与浅度挖掘两种。对于海量的数据选择而言,它有利于对出版社图书选题策划的信息功能分类,并深入选题策划内容。

最后是信息反馈,通过分析选题策划结果所涉及的图书制作交互日志来进一步获取数据挖掘方案,帮助出版社明确图书选题策划决策。

三、总 结

在“互联网+”时代,出版社应该妥善合理地选择相关选题策划技术,并围绕“互联网+”这一理念来丰富自己的技术理念与技术实操效果,充分发挥某些技术交流平台的作用来完善图书选题策划市场。正如文中所提到的信息采集与数据挖掘技术,将图书选题策划的运用科学化、人性化、丰富化。

参考文献:

[1] 余人,段雨濛.“互联网+”时代图书选题创意从哪里来[J].出版广角,2015(14).

[2] 徐剑.大数据时代图书选题信息的采集模式研究[D].安徽大学, 2015.

[3] 李汶羲.基于数据挖掘的选题策划的研究与设计[D].北方工业大学,2015.

猜你喜欢
图书市场选题数据挖掘
新年刊
选题有误
数据挖掘综述
网络环境下图书市场营销的对策分析
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
新媒体环境下图书营销新策略
确定选题,渲染气氛
光学测试题
一本面向中高级读者的数据挖掘好书