算法的把关研究

2018-02-08 07:02楼建坤陈泽玺国秋华
新媒体研究 2017年17期
关键词:今日头条算法

楼建坤 陈泽玺 国秋华

摘要 以今日头条App为代表的聚合类新闻客户端,依靠技术驱动,没有记者编辑,整个内容分发过程都由计算机操作。然而,这并不意味着这类媒介缺乏把关。文章在研究相关文献和观察体验的基础上,提出了“算法把关”的概念,得出了今日头条是由算法进行把关的结论,并结合计算机科学知识,介绍了相关技术应用情况,阐述了算法把关的实现形式和过程,并深入分析了依靠计算机算法进行把关产生的问题与隐忧。

关键词 算法;把关;今日头条

1问题缘起与文献综述

在手机新闻客户端市场激烈竞争的今天,以“今日头条”为代表的聚合类新闻客户端引人关注。不同于人民日报、网易新闻、腾讯新闻等传统媒体或门户网站延伸至手机建立的客户端,这类客户端不依托于原有媒体,而是直接通过技术手段聚合新闻,做大规模的内容分发,它们是移动互联网之下的直接产物。基于用户兴趣实现个性化推荐,是聚合类新闻客户端的最大特点,“今日头条”既是此类产品的先行者,也是领跑者。值得注意的是,“今日头条”的技术特色随后被其他手机新闻客户端所广泛借鉴,基于大数据的新闻推荐已成为“标配”,目前主流新闻客户端基本都能通过大数据挖掘信息,为用户精准推送新闻。

然而,这类技术驱动的新闻客户端,在没有记者、编辑的情况下,只依靠计算机进行信息分发,是否缺乏对信息的把关呢?如果存在把关,又是什么在把关呢?这些问题,值得我们关注。

把关理论是新闻传播学科最重要的理论之一。“把关人”的概念是美国社会心理学家、传播学奠基人之一库尔特·卢因提出来的,他认为把关人在对信息进行筛选的时具有主观性。随后,把关人理论的发展经历了一个从微观到宏观,从单一到复杂的过程,把关行为中越来越多的客观因素被考虑在内,从而打破了当初个人心理因素的单一视角,最终转为对媒介系统与社会系统关系、社会系统模式的研究。随着新媒体的发展,学界掀起了网络和新媒体环境下把关人的研究,焦点则集中在探讨把关人角色的擅变上。

随着媒介形态的迅速发展和媒介技术的更新,传统的把关理论不可能触及到所有新领域,对于聚合类新闻客户端的把关行为进行研究的相关文献不多。靳戈认为,“把关人”的形态在网络时代发生了重大变化。负责为用户筛选新闻、调整顺序的不是现实中的人,而是程序背后的算法逻辑。王成军试图从技术层面分析今日头条的传播机制和相关原理,对数据新闻、网络爬虫技术、聚合媒体平台及个性化信息推荐系统进行了介绍。他指出,算法或计算机把关有损新闻价值取向。陈滢在“使用与满足”的理论框架下讨论“今日头条”用户的需求满足情况。她认为,个性化新闻推荐在满足用户需求方面,仍存在一些问题,譬如信息茧房、信息无人把关等。

传统的把关理论认为把关是媒体的一种特有权利,然而随着新媒体的发展和新技术的应用,把关的权利已经得到下放,有着成为一种社会化权利的趋势。而且随着宏观研究的拓展,关于最终实现把关的微观领域被研究者所忽视。本文则是考察技术驱动的新闻客户端中的把关模式,考虑用户在把观众的作用,并重新回归把关研究的微观领域。

2今日头条:谁是把关人

传统大众传媒,记者采集新闻,确定内容范围,编辑对哪些稿件入选做出取舍选择,由记者加编辑实现把关,这一模式十分清晰。网络媒体虽然在之前一直未获得采编权,但网络编辑同样存在,他们编辑稿件并选择取舍,在网络媒体中充当着把关人角色。反观“今日头条”,它本身不生产内容,而是一个新闻聚合平台,所以也就不需要记者。初始运营阶段,“今日头条”靠网络爬虫技术抓取新闻资讯,变为自己的内容,做十足的“新闻搬运工”;在之后出现版权问题后,“今日头条”与传统媒体及各大网站变对抗为合作,建立头条号,邀请各大媒体、自媒体、机构等入驻,从而获得内容来源。无论怎样获得内容,都不需要亲自采集。同时,作为一个科技公司,“今日头条”也没有编辑存在,这个公司有的只是工程师、程序员和运营人员。没有记者编辑,“今日头条”是否缺乏把关人呢?笔者发现,针对每个用户的兴趣做个性化推荐,每个用户接收到的信息各不相同,在决定哪些信息被推荐给用户的过程中,其信息确实存在一个选择过滤的过程。由此可见,广泛存在于媒体中的把关现象,在“今日头条”的信息分发中也是存在的。那么,一个既没有记者又没有编辑的新闻客户端,一个对外宣称不是媒体的科技公司,是谁在把关呢?

首先,“今日头条”的运营人员在资讯分发的过程中确实起到了一定作用,如今日头条会用人工方式对敏感文章进行审核过滤,但这并非主要的把关形式,所以运营人员不是我们所认为的主要把关人。毫无疑问,不是人在把关,就只能是工程师所控制的機器在把关,因为最终的信息分发和推荐,都是通过计算机来实现的。而是什么组成计算机程序呢?是算法加数据结构。算法,是解决问题的一系列方法和步骤,这是个数学里的概念,也是计算机科学里的概念。算法是计算机程序的灵魂,也是组成各种不同技术的基础。

所以,归根结底,是计算机中的算法在把关,算法所起的作用才是最类似于把关人的,具体到聚合类新闻App或“今日头条”来说,是个性化推荐算法。虽然以往的传播学著作中从未提到过算法把关的概念,但通过观察与分析发现,在“今日头条”这类App中,计算机的“算法”,确实代替人起到了信息把关的作用,实现了最终的把关,并且对每个用户产生影响。

当然,在推荐算法进行把关的过程中,用户起到了极大作用。因为用户对新闻资讯的选择,其阅读、点赞、评论、收藏等行为都是主动为之的,用户的不同兴趣,是算法实现个性化推荐的基础。但我们发现,没有算法做出的把关行为的存在,整个用户兴趣发现的过程也就没有意义,个性化推荐也就无法实现,其结果是不会发生信息分发行为。所以,算法把关虽然裹挟了用户的“个人把关”,但却是占主导地位的把关行为。

总之,以今日头条为代表的聚合类新闻客户端,不是把关缺失的媒介形态,而是通过算法实现了信息把关,进行个性化推荐。

3算法把关的技术分析与实现过程

3.1算法把关的技术运用

算法把关是一种新型的把关模式。我们具体来探讨算法把关的实现方式。简单地说,算法把关的过程,是由不同算法组成的不同技术共同作用的结果。正如今日头条总裁张一鸣的介绍:“今日头条是一款基于数据挖掘的推荐引擎产品,结合了搜索引擎、数据挖掘、机器学习等技术。”

所谓机器学习,就是机器通过自己学习,并用学到的知识形成判断。机器学习与数据挖掘、大数据、推荐引擎有很多交叉之处,机器学习更加基础,被较多应用于其他技术中。

数据挖掘,就是利用计算机的强大计算能力,通过分析海量的原始数据,从中揭示出隐含的、先前未知的并有潜在价值的信息和规律的技术。数据挖掘是一门交叉性很强的学科,可以用到机器学习算法以及传统统计的方法,最终的目的是要从数据中挖掘到为我所用的知识,从而指导人们的活动,如阿里巴巴从大量的淘宝交易数据中找出有需求有能力的高质量小额贷款客户,就是利用了这一技术。当然,随着大数据时代的到来,数据挖掘要更多的适应大数据环境,“今日头条”的大数据挖掘,在业界是领先的。

搜索引擎技术则更好理解,我们已经习惯了有问题“百度一下”。其实“今日头条”可以看作移动设备中的百度,用户的阅读行为所展现的兴趣需求就是搜索的关键字,而推荐的内容则是搜索结果。然而“今日头条”更像是一个由算法实现把关的“推荐引擎”,而机器学习、数据挖掘、搜索引擎等技术的结合,共同实现了这一点。

3.2算法把关的实现过程

通过这些技术的组合,就可以进行个性化推荐了,算法就在这个过程中实现把关。头条号和其他合作媒体会源源不断的将内容发布到聚合平台上,获取大量内容之后,算法便开始起作用,即对信息进行大数据分析,通过分析,计算机对信息的属性做出判断,进行各种标签化分类,得出当下的热门资讯,从而为下一步推送做准备。

用户在使用“今日头条”的过程中,每观看一条新闻内容,每一次点击、浏览、收藏、评论等行为,甚至阅读这条信息的时间长短等都会产生数据。另外,用户在利用QQ、微博、微信等社交账号登录时,个人社交网络的信息也随之被记录。所有这些数据都被后台识别、判断并记忆,形成大数据。通过机器学习技术进行大数据分析,则可判断出用户对于哪些类别的新闻资讯感兴趣,进而形成包含了该用户兴趣的庞大数据。

将上述两个过程结合起来,“今日头条”根据计算出的每个用户的兴趣,选择已分类的相关内容进行个性化推送,从而实现了信息把关。根据用户日后的使用情况,若分析发现用户并非对某类内容感兴趣,机器就会对个人兴趣图谱进行完善和更新,并迅速对推送内容进行适当调整。所以,用户阅读的时间越长,次数越多,越能清晰地展现自己的兴趣,“今日头条”对用户的信息推送也就更精准。这种基于用户兴趣判断推送的信息内容,更能契合用户的信息需求,降低了信噪比,从而提高了用户获取所需信息的效率。

4算法把关的问题与隐忧

通过算法实现把关的“今日头条”改变了用户获取信息的方式,是新媒体环境下技术赋权的有力证据,它使媒介权利不再是支配性的,而是普遍化的,不再是专有权利,而是社会性权利。而这种信息的精准推送,满足了用户对信息的个性化需求,提高了用户获得有效信息的效率,从而使用户获得了良好的使用体验。在艾媒咨询所做的2015年手机新闻客户端用户满意度调查中,今日头条以8.7的评分位居第三,成为仅次于网易新闻和搜狐新闻的用户最满意客户端。但机器终归与人不同,机器能否代替编辑还值得商榷。算法把关的出现,依然存在着很多问题,必须引起我们的警惕。

4.1价值判断的缺失

信息也是有优劣好坏之分的。算法只能判断信息是否符合用户的兴趣需要,但无法分出信息的优劣,也无法做出价值判断,这是机器无法代替编辑的鲜明例证。机器只会抓取热门的新闻,但却不会按照某种价值观或是内容标准采录。或者说,之前媒体的标准在这里不复存在,有的只是算法所捕捉到的用户的好恶,这成为了“今日头条”的把关标准。“今日头条”通过算法将信息推荐给用户,无论好坏,只求契合需要。这就很容易陷入“唯用户论”的漩涡。用户在获取信息后,需要自己去判断优劣,这个过程极易受到不良信息的侵扰,色情凶杀暴力的内容,娱乐化的内容在所难免,这对用户的媒介素养是个考验。尤其是现阶段我国网民出现低学历化趋势,价值判断的问题可能更加严重。

4.2信息茧房的忧虑

用户在利用今日头条的过程中,不断地被算法推荐自己感兴趣的内容,但获得的这些内容,就是最好的吗?答案是不一定。如果只是一味的接受自己喜欢的信息,其他一些重要的信息可能就会因为是自己不感兴趣的内容而被忽略,信息偶遇行为也就不存在。因为不感兴趣,也就不会有相应的对该方面内容的阅读行为,机器也就不会捕捉到你的兴趣。长此以往,用户的信息结构会变得越来越单一,只关注几个方面甚至一个方面内容,自己给自己织造了一个“信息繭房”,将自己与其他信息隔绝,知识窄化的倾向在所难免。另外,通过观察发现,不仅内容,观点越近似的文章也越容易继续推荐,用户看得多了,很容易形成对某一问题看法的单一视角,误以为这就是主流,从而以偏概全。从根本上说,这是算法中构建的相似性矩阵太机械、不够科学合理造成的,这个问题有待进一步改进。

4.3内容生产的扭曲

由于算法把关实现的机器推荐对何为优质内容不能形成判断,许多内容生产者会寻求通过“标题党”等机器推荐中出现的漏洞,获得阅读量、转发率、点赞量。这种算法选择的倾向就对传统的内容生产造成了扭曲,它破坏了原有的价值标准。如此,“标题党”、越来越多打擦边球的内容将会出现,娱乐化、黄色新闻的泛滥也就在所难免。

5结束语

在今日头条App中,存在典型的算法把关模式,这种把关不同于传统大众传媒的记者编辑把关,而是通过算法支撑的计算机技术实现。算法把关在一定程度上是一种进步,通过不同算法不同技术的组合,计算机代替人来执行把关操作,从而节省了人力,且推荐的内容因为能满足用户的个性化需求,深受用户喜爱。但算法把关的实现,依然带来很多问题,价值判断的缺失、信息茧房的忧虑、内容生产的扭曲,都将制约其自身发展,并给用户带来不良影响。如何解决这些问题,只靠算法把关是否足够,是否将机器与编辑相结合才是更好的模式?这些问题值得我们深思。

猜你喜欢
今日头条算法
国际主流轧差算法介绍:以CHIPS的BRA算法为例
Travellng thg World Full—time for Rree
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
60亿收入进账但盈利仍未可知 “今日头条”创始人张一鸣底气何来
从“今日头条”看媒介融合
感知价值与满意度的关系研究
《今日头条》与《微信》的内容之战
济南法院集体入驻“今日头条”