大数据时代下的数字出版营销策略

2015-04-18 07:04
晋中学院学报 2015年2期
关键词:结构化数字消费者

杨 曙

(常州工学院人文社科学院,江苏常州213022)

早在1980年,未来学家阿尔文·托夫勒在《第三次浪潮》中将大数据称为“第三次浪潮的华彩乐章”。2009年,互联网行业中将大数据当成了流行词汇。2012年2月13日,美国《纽约时报》宣称,人类已经到达了“大数据时代”。2012年3月29日,奥巴马宣称,美国投资2亿美元开启“大数据研究和发展计划”,至此,大数据开发与利用成为如今美国的重要发展战略。同年,全球编辑网(GEN,Global Editors Network)发起和组织、谷歌公司进行资助奖励成立了数据新闻奖(DJA,Data Journalism Awards),这是国际上第一个表彰大数据新闻工作者的奖项,可以看出大数据在传媒领域中已被足够重视。对于数字出版行业而言,大数据解构了原先的营销体系,又重构了全新的营销可能。

数字出版营销体系的建立,需要分析优质的客户,促使数据引导生产、销售,使得数据贯穿在数字出版营销的整个过程当中,以此达到最佳营销效果。本文将讨论在大数据的背景之下,如何对数字出版营销进行改进,建立大数据时代的数字出版营销策略。

一、“大数据”概念

计算机分析技术和传媒报道进行结合,这并不是现在才有的事物:早在上个世纪50年代,美国就有记者专门用计算机来对政府的数据库信息进行分析,以此发现和调查新闻事实。[1]此后在西方,CAR(Computer Aided Reporting计算机辅助报道)兴起,人们在CAR领域中,开始不断地利用数据来挖掘新闻。无论数据是公开还是隐藏,记者都会注意去利用,以此作为从事新闻报道的重要资源。

对于大数据的概念,学术界还没有完全公认的定义,维基百科对大数据的定义,“无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合”[2];IT研究与顾问咨询公司Gartner则将大数据定义为,“在一个或多个维度上超出传统信息技术的处理能力的极端信息管理和处理问题”[3];美国国家科学基金会(NSF)这样定义,“由科学仪器、传感设备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集”。[4]不少人认为,从海量数据中快速获得信息就是大数据技术。

媒体的传统经营是建立在经验或者传统数据基础之上,比如利用一定的财务分析软件进行分析得到最后数据,这些数据由管理员通过事先特定程序安排获得,管理员获得的是结构化的数据(Structured Data),即数据库(Data Base),或是具有关联度的数据(Related Data)。(1)对于受众的调查,事先通过严格的随机抽样来进行调查,然后通过抽样来推断总体,利用财务软件去了解产品的供销和利润,以此来对整个数据进行分析和决策。

大数据概念源于众多非结构化数据(Unstructured Data),包含一些无关联的数据(Unrelated Data)集,其除了传统调查外,还含有社交网站、缺陷数据、人口数据、各种图片视频等,这些数据都是彼此毫无关联的,大数据的分析就和以往的传统结构化数据区分开来。大数据概念所涵盖的信息量远超出现有软件设施的承载力,多样化超出了传统线性财务软件工具的能力,快速化也对计算机的架构能力提出了新的要求。也就是说,大数据具有4V:大量化(Volume)、多样化(Variety)、快速化(Velocity)和价值密度低(Value)的特点。大量化,指的是数据数量很大,任何在线交易、社交网络都会传播大量数据。大数据呈现在各种行业当中,任何行业或个人的活动都会产生大量的数据,当前的数据规模已经从TB级别上升为PB甚至ZB级别。(2)多样化,指的是数据类型众多,囊括了各种音频、视频、图片、文本、交易信息。快速化,指的是对大数据的处理必须要快速,才能迅速了解环境并作出一定反应,做出合理对策,把握市场行情。价值密度低,大数据虽然具有很高的价值意义,但是价值密度偏低,如对于一个大型的阅读网站,受众可能只会选择其中的部分电子书进行阅读,大数据分析就要针对海量的信息进行论断。

大数据降临到传媒世界,和人类的社会生活有着十分紧密的联系,牛津大学教授Helen Margetts认为人类的行为留下不少的数字化痕迹,这些痕迹能够产生一些基于人为痕迹、社群关系、组织关系的数据,利用大数据能够很好地理解社会和自然之间的关系,并进而去影响政府政策、企业决策。在数据和数字出版结合之际,数字出版商可以对大数据进行分析,寻找出合适的需求,给消费者带来个性化的体验和满足,完成媒体销售的最大化。

二、大数据开辟未来数字出版中的应用方案

大数据对整个传统的数字出版营销方式产生了很大的影响,在这种大数据背景之下,未来数字出版营销方式需要出现一些转变,以下列举部分未来大数据应用中的典型模式来进行分析:

(一 )进行销售的精准策划

当前数字出版企业的竞争十分激烈,推出新的产品会有一定的风险。数字出版生产商必须在推出产品前建立一定的品牌形象,以此来减少产品的风险,增加产品的市场竞争力。在大数据的背景下,数据具有很强的经济价值。理性行为论指出,行动是一个人的意愿决定的,这个意愿是个人对社会行为的态度和社会反映。传统的营销方式仅仅关注消费者的话语表达,而从话语中不能深层次观察出受众的心理。利用大数据预测用户行为时,要详细了解消费者对事物的态度和消费意愿,关注消费者的心理诉求。对消费者进行数据分析,整合一定的碎片信息,通过相关计算得出消费者对消费物的态度。和传统的抽样调查相比,数字出版企业利用大数据能够十分准确地把握消费者的具体组成和各个阶段的心理需要,并重新调整经营手段,以此来阶段化调整数字出版各个阶段中的内容比重,针对性地提供服务,增加消费者的粘合度。

《卫报》是英国第二大日报,是业界使用新技术的重要先锋,其网站设置了专门的数据频道。2012年9月,其总经理发表了《数字新闻读者的“大数据”蕴藏巨大价值》,认为“大数据”可应用在媒体行业中,消费者的“大数据”隐藏很大的价值,不少数据能够吸引受众,并为内容商带来利益。[5]

(二 )针对消费者个性需要推出产品

个性化贯穿于整个信息化过程中,大数据能够将数据推向一个个性化方向,“这种个性化是基于系统通过分析读者阅读行为、喜好,从而获得对用户需求的感知。每个读者获得专属于自己的书,就是这种个性化服务的一种典型体现。在技术意义上,这种模式是能够成为现实的。”[6]针对消费者的个性化需求推出产品,消费者肯定会购买,当消费者对满足个性化的产品满意时,数字出版的内容也能实现其价值,整个企业能获得一定的进步。消费者接触各种营销推广信息时,消费者的情感态度、认知行为会发生一定的变化,对于这种变化,传统的小规模范围内的问卷调查无法获得准确的信息,根本做不到监测全部,大数据背景下的网络平台将发挥出巨大的作用。淘宝每天会遇到几亿用户,每个用户具有不同的爱好与特征,淘宝将消费者的信息搜集起来,进行大数据分析,根据消费者的个人需要再去投放最合适的个性化产品广告,从而达到淘宝销售传播的效果最大化。

建设个性化的数字出版平台能够把消费者和出版的企业联系起来,这点在当今大数据时代具有很重要的意义:(1)数字出版的个性化平台要和各种终端(手机、IPad)、社交媒体(微信、微博、论坛)进行无缝连接,促使消费者得到快捷的阅读和便利的分享体验。(2)数字出版内容的个性化定制购买与在线支付紧密联系在一起,这样,消费者就能轻而易举地购买产品。(3)个性化数字平台和数据分析商进行链接,实现消费者的体验需求。

例如,对于收费电子书,可以提供部分章节让读者进行阅读,这些电子书能够在被阅读时随时评论和分享。当读者在阅读时,平台能够及时收集到数据,关注到读者的静态与动态,读者的年龄、性别、收入、学历、地点、工作、读完免费部分会不会购买后继章节、读者一般在一页上停留的时间长短等信息全部被搜集起来,通过综合信息来分析和判断用户的经验。对于具有语音交互功能的数字出版App,数字出版商可以联合智能手机、IPad等阅读端的触摸屏、麦克风来监测用户的使用时间和场景,利用监测数据来评定这个App的质量。

(三 )优化研发生产整体平台

在现代数字出版企业管理过程中,数字出版产品自开始研发阶段,就由RDM(Research Development Management研发管理系统)进行管理,生产过程一般由ERP(Enterprise Resource Planning企业资源计划系统)和数字化制作工具管理,供应链由SCM(Supply chain management供应链管理)进行管理。如果使用系统对整个产品研发生产整体流程进行分析,就类似于将整个研发生产的整体流程进行扩大分析,并抽取精华进行观察,这对优化整体流程,提高产品的质量与生产效率具有很大的意义。

产品研发过程中,可以实时利用大数据一起来建设协同编纂平台,在这个平台当中,作者、生产商、编辑、校对、平台商等相关工作人员可以一起进行协同编纂,并进行协同发布,形成新的BPP(Business Process Platform企业业务流程平台)。在这个协同编纂平台中,作者、生产商、编辑、校对、平台商等相关工作人员在工作过程中产生大量的非结构化数据。利用大数据对这些非结构化数据进行分析,往往能发现文本中的常见错误、制作中的瓶颈、工作人员能力的欠缺等,相关工作人员从而可以在后继的工作过程中拾遗补缺,调整工作方法,采取措施进行应对。当今诸多消费者不愿付费阅读的问题也可能会被较好地解决。鉴于协同编纂的兴起,数字出版企业就能根据目标消费者阅读需求来开发数字产品,注意产品的设计者、生产商、编辑、校对、平台商等每个环节工作人员与消费者之间的互动情感,对消费者的反馈信息进行开发,反思协同编纂中哪些工作环节导致消费者付费意愿不高,促使开发消费者付费心理的问题在根本上得到重视,这样,消费者就会拥有付费的意愿。

(四 )国有数字出版媒体利用大数据做出表率

我国的国有数字出版单位属于“事业性质,企业管理”,同样也受到大数据的影响。国有数字出版单位生产力的未来提升,必然和大数据的获取、释放紧密相关。西方的媒体、政府、公民三者实行“媒体-政府-公民”三足鼎力趋势,三者之间保持相对独立,媒体得不到政府的资金或数据支持。我国的国有数字出版单位来源于国有传统媒体,充当着党和政府的喉舌,比其他商业媒体容易获得大数据。国有数字出版单位在不违背保密原则的前提下,应该尽可能和政府保持沟通,获得一个议题的全部数据,分析相关性,并最后释放到产品生产,这样就能在和他国媒体、其他商业媒体的竞争中保持自身的优势。国有数字出版单位对数据的获取和释放有着一定的依赖度:(1)国有数字出版单位依赖政府收集数据的程度;(2)国有数字出版单位依赖政府释放大数据的程度。大数据时代,国有数字出版单位的力量想壮大,数据权限的获取和释放程度是很重要的方面,国有数字出版单位在优先利用大数据将自身产品做大做强时,也就为其他商业媒体做出了表率,提示了一定的经营路径。

三、未来大数据技术在数字出版中存在的缺陷与挑战

当大数据如火如荼地在数字出版中展开之时,目前的大数据运用还面临着很多的缺陷与挑战:

(一 )XML格式输出技术不成熟

根据国际知名调研机构Forrest Research的统计,有15%的信息存储在各种类型的结构化数据当中,85%的信息分布在组织的整个业务过程和外部环境中,其中只有5%被经过了数字化处理。[7]网上的评论、图片、视频、传感器的数据,这些不是传统的结构化数据。早在1986年,国家标准化组织出台了SGML(Standard Generalized Markup Language标准通用语言),这是一种定义与描述文档内容的国际标准语言,SGML在Web之前出现,所以不能用于网络,随后XML(Extensible Markup Language可扩展标记语言)出现,XML整合Windows、Linux、Unix等操作系统下的数据信息,将非结构化数据全部以XML格式输出——该问题成为当前大数据技术中的重要难题。依托大数据,从庞大的非结构化数据中来揭示新的意义和关系,并实现精准生产和精准营销是当下数字出版面临大数据而努力的方向。只有完善的XML格式输出技术,未来的数字出版才能做到聚类分析、聚类融合、网络分析、数据集成、可视化分析等。

(二 )收集渠道闭塞

搜集各种信息来完成大数据采集是数字出版未来的趋势,但目前的数字出版信息搜集仍存在一些缺点:(1)数字出版产品在整个研发、生产、销售过程中还没有彻底完成信息化经营,整体搜集难度显得较大;(2)数字出版的云存储平台根本不具备海量存储功能;(3)数字出版中的内容商、平台商还没有完全转换成数据提供商,因此,他们无法及时获取数据;(4)当前的数字出版产品无法记录消费者使用过程中的痕迹,因此即使数字出版中的内容商、平台商变成数据提供商,也无法记录数据。

(三 )高端数据分析人才极其匮乏

对大数据进行分析,熟练运用Hadoop、MapReduce、分布式文件系统、并行计算框架等技术的人才十分缺乏,而很多高校的计算机和出版专业也没有专设数据分析研究方向来培养学生,这也直接导致数字出版领域的高端数据人才匮乏不堪。

(四 )数字出版商仍旧无法转变经营思路

从数字发展趋势看,数字出版商要高度重视数据的搜集、整理和应用。目前数字出版内容商、平台商仍旧将自己的经营思路定于原始粗糙的财务分析软件分析基础上,没有从战略高度看待大数据的到来,没有意识到大数据对整个数字出版经营的重要价值。利用大数据进行产品设计、广告开发、效果测定、企业改革,需要一定的管理与经营思路转型。

四、结语

法国社会学家布尔迪厄认为,场域是由社会成员按照特定的逻辑要求共同建设的网络或构造,[8]142在美学场域、宗教场域、政治场域、文化场域等特定场域的内部都存在着斗争,存在着为争取权力来界定一个场域的斗争。虽然布尔迪厄没有预测到大数据对当今数字出版的重大影响,但是我们明显看出大数据在当今的数字出版场域中的权力运行。大数据渗透到数字出版生产和消费的场域后,其强大的技术优势和观念深入人心,成为数字出版经营中的一种权力符号,改变数字出版生产和消费场域的生产关系。虽然当前大数据技术在数字出版当中还未达到完全成熟,但是随着未来的云计算数据和大数据人才输送机制的成熟,大数据技术将会在数字出版行业中占有越来越重要的位置。

注释

(1)大数据时代,信息系统会留下各种各样的数字痕迹,这些数字痕迹大多是非结构化数据,应该要经过整合分析,以此推断个体的运行轨迹,这些分析与推断完全需要技术和工具。结构化数据(Structured Data)是指具备一定结构性、可以划分成固定基本要素、能够用一个或多个二维表来表示的数据。结构化数据大多存储于关系数据库,并带有特定的逻辑结构。非结构化数据(Unstructured Data)是指结构化以外的数据,“数据结构不固定,无法用关系数据库存储,如office文档、文本、图片、财务报表、图像、音频和视频等”。

(2)1TB=1024GB,1ZB=10亿 TB。

[1]卜卫.计算机辅助新闻报道:信息时代记者培训的重要课程[J].新闻与传播研究,1998(1):11-20.

[2]维基百科.大数据[EB/OL].http://en.wikipedia.org/wiki/Big.data.

[3]Gartner.Bigdata[EB/OL].http://www.gartner.com/it-glossary/big-data/.

[4]Nationai Science Foundation.Upcoming Due Dates[EB/OL].http://www.Nsf.gov/funding/pgm_summ.jsp?Pims_id=504767.

[5]陈昌凤.“大数据”时代如何做新闻?[J].新闻与写作,2013(1):90-92.

[6]尹琨,任晓宁.大数据开启数字出版瑰丽想象[N].中国新闻出版报,2013-11-28(5).

[7]张德政,张萍萍.非结构化信息管理[J].微计算机信息,2006,22(3):218-219,230.

[8]布尔迪厄.文化资本与社会炼金术——布尔迪厄访谈录[M].包亚明,译.北京:人民出版社,1997.

猜你喜欢
结构化数字消费者
促进知识结构化的主题式复习初探
消费者网上购物六注意
结构化面试方法在研究生复试中的应用
答数字
知识付费消费者
数字看G20
悄悄偷走消费者的创意
悄悄偷走消费者的创意
基于图模型的通用半结构化数据检索
成双成对