基于Petri网的视频审核流程建模优化分析①

2021-07-05 01:51
关键词:变迁人工稿件

郭 鑫

(安徽理工大学数学与大数据学院,安徽 淮南 232001)

0 引 言

Petri网作为一种建模工具,不但可以进行建模还可以利用其性质对模型进行评价,因此目前被广泛应用各行业的业务流程中[1-3]。此前并没有学者将Petri网应用在视频审核领域,但做了一些相关工作,例如:文献[4]从语义分析和卷积神经网络的角度,将不同领域的技术进行融合,促进了视频审核技术的提高。文献[5]论证了视频版权保护的必要性,分析了视频版权保护的现状及应对的方法。专利[6]提出了一种视频审核的调度机制,根据视频内容赋予一个调度因子,利用该因子进行调度优先等级排序,达到提高审核资源利用率的目的。文献[7]提出了一种基于深度学习的台标检测方法,可以将其应用在视频审核中,作为检测侵权的一个指标。

运用Petri网中行为轮廓的相关知识,建立基于自由选择Petri网的审核流程模型,覆盖从用户投稿、平台审核到最后发布的基本流程。提出一种优化分析方案,主要从版权审查、检测效率、人工资源利用三个方面入手,对原模型进行优化,并给出优化后的模型。利用PM4PY、PIPE软件对模型进行仿真实验表明,优化后的模型稳定、有界、安全且无死锁。

1 基本概念

定义1[8](流程模型Petri网) 一个流程模型Petri网PM=(P,T,F,C,s,e)是一个六元组,满足下列条件:

(1)P是有限库所集,T是有限活动变迁集;

(2)P≠Ø,T≠Ø=且P∩T≠Ø;

(3)F⊆(P×T)∪(T×P)表示PN的流关系且(P∪T,F)是强连通图;

(4)dom(F)∪cod(F)=P∪T,其中

dom(F){x∈P∪T|∃y∈P∪T,(x,y∈)}

cod(F)={x∈P∪T|∃y∈P∪T,(y,x∈F)}

(5)C={and,xor,or}是流程网的结构类型;

(6)M0是网的初始标识,Mj是网的终止标识,且Mj是死标识;

(7)s∈T是活动开始的变迁,e∈T是活动终止的变迁.

则称该网为流程模型Petri网。在此定义上,定义了网的前集和网的后集。

定义2[8](变迁发生规则) 一个四元组PN=(P,T;F,M0)称为Petri网,并具有下面的变迁发生规则:

(1)变迁t∈T具有发生权,当且仅当对∀p∈t:M(p)≥1,记作M[t>;

(2)在标识M下能使得变迁t经发生后,得到一个新的标识M′,记作M[t>M′,则有

定义3[9](行为轮廓) 设(N,M0)是一个网系统,其中N=(P,T,F),M0是初始标识,∀(t1,t2)∈(T×T)满足如下关系:

(1)若t1≻t2且t2≯t1,则称严格序关系,记作t1→t2;

(2)若t1≻t2且t2≯t1,则称排他序关系,记作t1+t2;

(3)若t1≻t2且t2≯t1,则称交叉序关系,记作t1‖t2;

若t1≯t2且t2≻t1,则称严格逆序关系,记作t1→-1t2,并将以上几种关系构成网N的行为轮廓,记为BP={→,→-1,+,‖}。

2 基于Petri网的视频审核流程构建

在视频审核中,虽然目前引进了计算机技术和人工智能学习算法,但仍需大量的人工对视频进行审核、抽测,审核流程是否合理极大影响视频审核的效率。依据某A网站的视频审核流程,利用Petri网建立了模型如图1所示(以下称原模型):

图1 视频审核流程原模型

表1 图1中变迁符号的含义

由图1可知,原模型的流程为:在用户投稿t0发生后,进入平台审核流程t1。t2和t6是排他关系记做t2+t6,根据用户上传时声明的转载还是原创进入不同的流程。t2发生声明转载后,会对视频进行版权归属的检查t3,t2和t3属于严格序关系,记做t2→t3。根据该用户对该视频拥有的权利进入排他关系的t4和t5中,没有版权的t4发生后就会对稿件进行退回,等待用户处理;有版权的t5发生后会和原创的视频的流程进行合并。在t6原创发生后,进行t7声画抽帧检测和t10人工复检的流程,检测通过则进入t13,检测未通过则退回给用户t14。声画抽帧检测会过滤掉大部分的问题稿件,可以大大缓解人工检测的压力。

对于退回给用户的稿件,用户修改稿件(t15)后可以重新投稿,平台会再次进行审核。在此过程中,t14、t15和t0处于严格序关系,记做t14→t15→t0。

3 模型优化

图1构建的原模型虽然较为完善,但在实际应用中仍然存在以下问题:

1)侵权审查环节薄弱。由图1可以看出,平台只会依据用户上传时是否声明原创而采取不同的措施,但有的稿件中可能夹杂着其他作者的视频,或进行了二次创作,或恶意声明原创。又没有利用技术手段进行审查,很难将这些行为筛查出来,导致视频侵权行为时有发生。

2)审核效率较低。由图1可以看出整个审核过程只有一条流程,因此从上传到发布需要等待较长时间,特别是周末节假日等自媒体创作的高峰期,审核流程已经饱和,无法加快审核速度,导致等待时间更长;或是在某个热点爆发的时候,会有大量的稿件集中爆发,如果还是按正常的流程审核的话可能会错过该热点。

图2 视频审核流程优化后模型

3)人工资源利用率低。调查显示95%的网络视频是符合发布标准的,但是剩余的5%却产生极大的社会危害。从图1中可以看出,对所有的稿件都采用相同标准的人工复检率,造成了人力资源的浪费。人工审查应重点应用于敏感问题的审查,对于国家法律法规明令禁止的信息,机器在识别和判断上有一定的限制,人工资源的优势将在这个环节凸显。

针对问题1,平台需要加强版权审查。提出在原模型基础上增加部分检测。对原创稿件增加台标检测t7和重复片段检测t12,台标是视频平台对本平台视频增加的一个标识,可以一定程度上说明版权归属问题,同时对故意抹除、打码台标位置的稿件进行重点检查。重复片段可以证明稿件的原创率,综合考量稿件的原创性。

针对问题2,增加一个审核排序因子,由该因子来决定调度也就是审核顺序的问题,为了计算出调度因子,需要获取该用户相关信息t18-t28,计算出历史被举报概率t19、视频热点等级t22、影响力因子t26、历史审核通过率t29、视频号质量t30,最终计算出审核排序因子t31,交由系统调度审核。

针对上述问题3,设置两个人工复检概率,对于一般主题的稿件采取低人工复查率t35,对于特殊主题稿件采取搞人工复查率t39,充分利用人工资源。t34、t38处于排他序关系,记做t34+t38,同样t36和t37也属于排他序关系,记做t36+t37。

表2 图2中变迁符号的含义

4 仿真实验

PM4Py(process mining for python)是由弗劳恩霍夫应用信息技术学院(FIT)的processmining小组开发的一款基于python的开源工具。该工具设计用于学术界和工业界,是一个领先的开源的过程挖掘平台。因此,利用PM4PY建模并验证模型的稳定性。

from pm4py.visualization.petrinet import PetriNet, Marking,factory as pn_vis_factory

from pm4py.objects.petri import check_soundness , utils

net = PetriNet("model2")# creating an empty Petri net

p_0 = PetriNet.Place("p_0")# creating place

......

p_45 = PetriNet.Place("p_45")

net.places.add(p_0)# add the places to the Petri Net

......

net.places.add(p_45)

t_0 = PetriNet.Transition("t_0", "t0")# Create transitions

......

t_42 = PetriNet.Transition("t_42", "t42")

net.transitions.add(t_0)# Add the transitions to the Petri Net

......

net.transitions.add(t_42)

utils.add_arc_from_to(p_0, t_1, net)# Add arcs

......

utils.add_arc_from_to(p_2, t_17, net)

initial_marking = Marking()# Adding tokens

initial_marking[p_0] = 1

initial_marking[p_45] = 1

final_marking = Marking()

final_marking[p_42] = 1

gviz = pn_vis_factory.apply(net, initial_marking,final_marking)#output graph

pn_vis_factory.save(gviz, "model2.svg")#save graph

checkr_result=check_soundness.check_stability_wfnet(net)#check soundness

图3 程序自动生成的原模型图

图4 程序自动生成的优化后模型图

为了验证优化模型是否具有良好的性质,利用PIPE(Petri网分析软件)进行仿真实验,结果如图5所示,优化后的模型是有界、安全且无死锁的。

图5 优化后的模型状态空间分析结果

5 结 语

现阶段的视频审核的业务流程存在检测效率低,检测质量不高等问题,增加了分时审核因子、台标检测等步骤,优化了视频平台检测的流程模型,还加强了版权保护方面的验证,为视频版权保护贡献平台力量。通过仿真实验表明,优化后的模型有较好的稳定性,并且是有界、安全和无死锁的。因此可以将优化后的模型应用到视频审核流程中。在研究中提出了几个优化的方向,未能给出具体的措施,仅仅是将其加入到模型中,未来考虑精进优化的方向及措施。文中引入PM4PY这个过程挖掘平台来进行验证工作,未来的研究着眼于提出更好的算法来辅助建模工作。

猜你喜欢
变迁人工稿件
人工3D脊髓能帮助瘫痪者重新行走?
征集汽车电子类稿件
整合品牌栏目 征集优秀稿件
小渔村的变迁
整合品牌栏目征集优秀稿件
人工“美颜”
回乡之旅:讲述世界各地唐人街的变迁
一纸婚书见变迁
清潩河的变迁
人工制冷