挑战播客监管新课题适应网络斗争新形势

2011-02-08 02:13
中国传媒科技 2011年7期
关键词:影视节目归类热点

挑战播客监管新课题适应网络斗争新形势

播客作为一种新兴的网上视听媒体传播形式,在互联网视听节目传播中占有十分重要的地位,成为广大网民在线观看视频和上传视频的主要途径,但也存在着一些不容忽视的问题。为进一步落实监管职责,加强对播客网站的管理,国家广电总局2008年4月批复监管中心建设“播客视频节目监管系统”,以扩大互联网视听节目监管范围,为管理部门规范播客网站视听节目传播秩序提供更高效的技术手段。

播客视频节目监管系统由30多台搜索机集群服务器,以及业务处理分析服务器、数据库服务器、存储阵列、负载均衡、防火墙、交换机等设备组成,包含节目归类、热点监控、播客监控、网站监控、影视监管、视频专题等30个功能模块。以国内156家重点播客网站为监控对象,根据播客网站的技术特点,在播客视频节目深度采集、多层次热点话题聚类、智能化视频节目归类、播客影视节目排重和传播动态分析等技术上进行了创新,解决了播客网站节目数据大规模抓取、视频热点自动聚类、播客节目自动归类、播客发布者管理、影视节目传播分析等多个技术难点。

该系统实时采集、分析、发现播客网站上最新的视听节目,对热点信息进行话题聚类与跟踪,对播客网站上的视听节目按照电影、电视剧、动漫、新闻等重点类别进行自动归类,建立了播客发布者黑白名单,可以及时掌握播客网站上节目传播趋势与动态,记录和下载各类违规节目,跟踪其扩散范围与演变趋势,并能对各类注册并发布节目的播客进行登记和跟踪,对播客网站上传播的影视节目版权信息进行核查。播客视频节目监管系统在研制了面向播客网站的深度视频信息采集子系统、播客视频热点自动发现技术、面向播客的智能化视频节目归类技术、播客影视节目排重和传播动态分析技术方面,都有创新。

播客具备WEB2.0时代传媒形态的典型特征,如自主的信息传播方式,以音视频为主的信息传播内容等。从发展轨迹来看,播客发展速度比当年博客更为迅猛,这种新传媒形态已成为互联网视频传播的主流。网络视听媒体在丰富人民群众的精神文化生活的同时,也存在着为不健康的内容提供了传播渠道。例如,境内部分网站片面追求经济效益,无视政府法规,在网络视听节目中播放、转播、链接含有色情、暴力甚至反动的节目内容。党中央和国家领导高度重视信息网络视听节目传播管理工作,对互联网络信息安全保障工作提出了更高的要求,明确广电总局对IP电视、播客和手机视听节目业务负有监管职责,并多次批示要求“加快完善视听节目监控中心建设,尽快运作监管体系”,“要加强网络视频节目监看,加快完善视频监看平台建设,以适应网络斗争的新形势”。

播客视频节目监管系统于2008年10月开始建设,2009年6月投入运行至今,软硬件运行稳定,监控范围涵盖156家重点播客网站,平均搜索周期小于9小时,已保存节目元信息数量超过9500万条,音视频平均遗漏率小于2.2%,热点排行更新周期小于4小时,首页内容提取准确率达到100%,保存节目信息重复率小于0.1%。建立了播客网站基础信息库、视听节目库、视听节目索引及特征库等各类信息库,在“打击整治网络淫秽色情等有害信息专项行动”、“六四二十周年专项监控”、“新疆7·5事件”、“国庆六十周年”、“茉莉花革命”等重大专项和日常监管任务中,为总局对播客网站管理提供了大量及时、准确的监管数据,为维护国家信息安全和文化安全,提供了有力的技术支撑手段。

系统设计以国内重点播客网站为监测对象,实时采集和分析网站上的视听节目信息,发现最新的音视频节目,对热点信息进行话题聚类与跟踪,及时掌握网上视听节目传播趋势与动态;对播客网站上的视听节目进行归类,对电影、电视剧、动漫、新闻等重点类别节目进行重点监管;对发现的违规节目进行记录和下载取证,跟踪其扩散范围与演变趋势;建立播客发布者黑白名单,对在播客网站上登记注册并发布节目的播客发布者按违规情况进行登记;对已审批播客网站的备案信息进行核查,发现违规情况并自动报警提示;对播客网站上传播的视听节目版权信息进行核查,对侵权盗版行为进行记录;通过建立播客网站基础信息库、视听节目库、视听节目索引及特征库等各类信息库,初步建立播客网站视听节目信息数据库,为播客网站的监管工作提供较为全面、准确的监管数据资料。

基于内容分析技术对热点和舆情信息进行发现和跟踪是监管的重点之一。由于网站节目类别多样,热点分散,同时视频信息文本内容少,需要系统具有较强的节目自动归类和热点话题聚类能力。针对上述问题,播客视频节目监管系统

在节目、关键词、话题等三个层次上进行在热点信息的发现和舆情分析。在节目热点发现层次,与传统的基于点击量绝对值发现热点节目的方法不同,系统采用了基于节目点击量和评论时间变化曲线分析,发现热点节目的策略,取得了很好的效果;在关键词热点发现层次,基于数据挖掘方法,并充分结合播客节目数据的本身特征,包括标题、标签、分类、热度、发布时间等信息,利用关键词在不同时间段内的热度散布特征,提出了一种面向视频等短文本数据的热点关键词发现算法,在系统应用中取得了较好的效果;在话题热点发现层次,系统使用了一种新的视频话题检测算法。采用二部图模型表示视频和关键词的双向关系,通过该模型,视频不仅可以用关键词表示,也能用作特征以传播文本信息。通过分析视频和关键词的关联结构能减少文本噪声,基于该模型对视频进行聚类,能够有效发现最新的热门视频事件。在系统实际数据的测试表明,该方法具有较好的有效性,方法具有一定的创新性。

播客视频节目监管系统的建立运行,填补了国内对播客网站视频节目监管的技术手段空白,进一步扩大了互联网视听节目有效监管范围,在面向播客网站的深度视频信息采集、热点话题、热点词汇、热点节目分析、智能化视频节目归类等方面取得了新的突破,积累了播客发布者黑白名单、播客网站影视节目库等基础数据。

该系统从2008年10月开始建设,2009年6月上线试运行至今,监控目标156家,保存各类节目元信息9500多万条,记录个人播客信息超过800万,机构播客1300多个,播客群组1.6万个,建立了20个大类83个小类的节目分类,包含10000多条电影、电视剧、动漫、记录片的播客影视节目库,以及播客网站基础信息库、视听节目库、视听节目索引库及特征库等播客视频节目基础信息库。

在“打击整治网络淫秽色情等有害信息专项行动”、“六四二十周年专项监控”、“新疆7·5事件”、“国庆六十周年”、“茉莉花革命”等一系列重大专项和日常监管任务中为监管工作提供了大量及时、准确的监管数据,并为进一步打击影视节目盗版源头,维护影视节目版权,提供了数据基础和技术手段。

播客视频节目监管系统实现了对国内156家播客网站上9500万条视频节目的有效监管,平均搜索周期小于9小时,音视频平均遗漏率小于2.2%,热点排行更新周期小于4小时,首页内容提取准确率达到100%,保存节目信息重复率小于0.1%。2010年8月26日,广电总局科技司组织有关专家对播客视频节目监管系统进行了技术鉴定,鉴定组一致认为该系统具有创新性,填补了国内空白,达到国际领先水平。

播客作为一种新兴的网上视听节目传播形式,在互联网视听节目传播中占有十分重要的地位,并已成为互联网视听节目传播的主流形式,播客网站视听节目传播秩序直接关系到国家文化安全。如今播客视听节目传播的发展和监管是全世界共同面临的新课题,它具有信息海量、传播形式多样且不断更新、受众人群众多等特点,仅仅依靠人工手段开展监管工作,根本无法适应网络视听节目的发展形势,这对所有网络文化的建设者和管理者而言,既是新的机遇,也是新的挑战。因此播客视频节目监管系统挑战了播客监管新课题,适应了网络斗争的新形势。

图1 系统的软件架构

图2系统硬件构成

猜你喜欢
影视节目归类热点
热点
电表“对”与“错”归类巧掌握
以《中国诗词大会》为例浅析中国电视节目创作模式的变化
天气预报影视节目中动画效果的应用制作
热点
基于教学做一体化的高职影视节目制作课程设计研究
Happiness through honorable actions
结合热点做演讲
分式方程应用题归类解说
影视节目“东北方言热”现象探析