曾祺
(中国人民公安大学信息技术与网络安全学院,北京102623)
视频研判过程中信息来自多个方向,既包括刑事案件中“人”、“事”、“物”、“时间”、“空间”等要素,又包括各要素之间的对应关系。这些研判知识目前只存在于书本或侦查专家的大脑中没有统一的格式很难实现信息的交换、共享以及重用。本体在语义和知识表示层面能够提供一种规范化的表达方式对知识进行操作。研究中引入本体技术来构建一个视频研判的知识模型,通过构建视频图像侦查领域本体对视频研判涉及的各要素中提取的概念以及概念之间的关系进行描述,利用Protégé软件实现领域本体的构建并展示各概念层次关系和对应关系,最后使用OWL语言对该领域本体形式化表示,让计算机可以交换、共享、重用视频研判知识。
本体是源于哲学的词汇,被引入到人工智能领域后有很多专家学者对其做了新的定义,针对不同的领域本体有许多不同的定义。但总体来说研究者对本体的认识是一致的,本体是不同主体(例如人和计算机)之间一种交流的语义。涉及特定学科领域的本体,被称为领域本体[1]。领域本体中表达的语义关系及推理规则集合可以用来推理,实现基于本体的智能分析和知识组织。
本体作为概念模型可以由一个五元组O=(C,R,F,A,I)来形式化表示。其中C表示类,R表示关系、F表示函数、A表示公理、I表示实例。类(Class)从广义上讲指概念,是某种对象的集合。关系(Relation)代表各类之间的关联,最常见的是二元关系,例如概念间的is-a表达了概念的层级关系。公理(Axiom)是公认的推理规则,用来知识推理。函数(Function)是关系的特定表达式,函数中的映射关系使得推理从一个概念指向别一个概念。实例(Instance)是本体中最小的对象,具有原子性、不可再分性。
本体的表示语言以描述逻辑为基础,是一种规范、完整的语言体系[2]。它的主要功能有:帮助本体从自然语言的格式转换为机器可读的逻辑表达格式;提供机读格式让本体在不同的系统之间导入和输出;形式化的表示语言,可以直接在计算机中存储、加工、利用并且在不同系统间进行互操作。
OWL(Web Ontology Language)沿用了 RDF 的 SPO三元组形式来表达概念间的关联,引入了许多预定义词汇来克服RDF和RDFS对概念、属性之间关系的表达能力不足的问题。具体的OWL语言组成词汇如表1所示:
表1 OWL语言中的词汇
领域本体在开发过程中既要有对整个开发过程的指导方针又要有具体的实施步骤[3]。现有的较为成熟的本体构建方法都是在各领域本体研究过程中总结出来的,尚未形成统一的标准和原则,很难指导一个完整的本体开发过程。通过对斯坦福大学开发的七步法和爱丁堡大学人工智能研究所开发的骨架法的仔细研究,提出了构建视频图像侦查领域本体的指导方法,具体流程如图1所示:
图1 视频图像侦查领域本体构建流程
目前尚未找到可以利用的视频图像侦查领域本体,但侦查领域的本体有人研究过。例如“刑事案件领域本体”,该本体根据刑事案件中的要素来定义本体的类以及属性能够完整地、形式化地表示刑事案件,借鉴其方法对刑事案件的构成要素进行研究获取相关知识。参考《视频图像信息应用计战法》、《三定侦查法》、《犯罪心理研究》、《轨迹侦查》、《新编犯罪心理学》等侦查类书籍并结合公安行业标准中的《刑事犯罪信息管理代码》来获取有关侦查知识。
视频图像侦查领域本体是为了将实际视频图像侦查工作中的研判知识和推理经验编码成机器可以处理的语言,让机器代替侦查员实现智能侦查研判工作。视频图像侦查是以视频图像信息为主联合网络、卡口、通讯等其他信息[4],对犯罪嫌疑人的各方面特征进行提取,依据侦查经验和犯罪学理论对嫌疑人进行心理画像或预判嫌疑人活动轨迹。所以在视频图像领域侦查本体中主要包括视频侦查技战法、刑事案件侦查、犯罪心理研究这三个方面的知识。构建该本体是针对实际工作中侦查员疲于处理大量的视频信息以及其他多方面的线索信息的情况,帮助侦查员提高研判侦查信息的效率。
要素,是指事物必须具有的实质或本质性的组成部分,是构成事物的必要因素。本体也是由类、属性、关系、公理、实例等五大要素所组成。构建视频图像侦查中线索研判领域的本体就必须要弄清楚视频图像侦查中线索研判的要素。视频图像侦查是现代侦查手段中的一种,其目的是为了刑事案件的侦查终结。刑事案件的侦查终结,实质就是查清了刑事案件的全部要素[5]。所以刑事案件的基本要素也就是视频图像侦查中线索研判的基本要素。根据刑事案件要素的构成,将“人”、“事”、“物”、“时”、“空”这五个基本要素进行分析后,领域本体的构建将围绕着这五个要素进行,如图2所示为视频图像侦查领域本体概念模型。
图2 视频图像侦查领域本体概念模型
刑事案件中的人是与刑事案件有关联的人(例如:犯罪嫌疑人、受害人)或了解案件相关情况的人(例如:证人),因此构建“犯罪嫌疑人”、“受害人”、“证人”三个类。然后再根据实际侦查过程中对犯罪嫌疑人进行研究时所关注的特征,例如:社会特征、地域特征、心理特征、既往的犯罪特征等,提取出以下与犯罪嫌疑人的特征类。在实际侦查中每种特征的取值是复杂多样的,在构建本体时抽象概括出各种特征类的取值状态。
例如:
犯罪嫌疑人
受害人
证人
经济状态:困难、温饱、富裕
婚姻状态:已婚、未婚、离婚
文化程度:文盲、中学文化、大学文化、专科技校
前科记录:初犯、累犯、惯犯
人际关系:简单、复杂
心理气质:胆汁型、粘液型、多血型、抑郁型
犯罪心理结构:危险心结、反社会人格
惯用伎俩:常见伎俩、少见伎俩、特殊伎俩
就业状态:在职、临工、无业
职业史:厨子、司机、军人、警察
反侦察行为:手法专业、手法简单、不存在
在实际的侦查研判[6]当中,侦查员主要以犯罪嫌疑人使用的凶器、驾驶的交通工具、联系用的通讯工具、从案发现场带走的赃物以及其他辅助作案的工具等物品为线索寻找与犯罪嫌疑人有关的信息。因此以物为要素主要构建“凶器”、“交通工具”、“通讯工具”、“赃物”、“辅助作案工具”五个类。凶器的来源可以判断犯罪嫌疑人的动机是有预谋还是激情犯罪。凶器的种类也可以判断犯罪嫌疑人的职业经历。交通工具的来源可以分析嫌疑人经济状况。交通工具的种类可以分析嫌疑人的职业、活动轨迹。交通工具的轨迹可以分析嫌疑人的轨迹、地域特征等。通讯工具的通话记录可以分析嫌疑人的活动轨迹。赃物的体积可以分析嫌疑人的交通工具、是否有同伙。赃物的种类可以分析作案人的文化程度、作案经验、作案目的。辅助作案工具的种类可以分析嫌疑人的职业、惯技。因此提取出相关类如下:
凶器
交通工具
通讯工具
赃物
辅助作案工具
凶器来源:自带、就地取材
凶器种类:自制武器、可购买武器、非法持有武器
交通工具来源:租借、盗取、抢劫、购买
交通工具种类:人力车、农用车、摩托车、普通汽车
赃物重量:很大、一般、较小
赃物种类:现金、珠宝首饰、有价证卡、电子产品、工业原材料
辅助作案工具种类:技巧工具、暴力工具、特殊工具
任何与犯罪有关的行为都在特定的空间发生,因此构建“空间”类。依据POI的分类每一个空间都有对应的POI类别,这些类别对分析嫌疑人的活动轨迹、经济状况、交通工具、心理状况等都有帮助。根据轨迹空间的描述又将空间分为上一个时间点空间、当前时间点空间、下一个时间点空间。在实际侦查中又将可以根据空间在犯罪活动中的功能进行分类例如实施地、落脚地、销赃地、藏匿地(藏匿赃物、尸体等)。因此构建类如下:
地点
上一个位置
当前位置
下一个位置
地点犯罪性质:实施地、落脚地、销赃地、藏匿地
地点社会性质:出生地生长地工作地
POI类别:餐饮、购物、住宿、出行、文体娱乐、金融服务、生活服务、汽车服务、教育、医疗、房产、旅游、企事业单位、行政机构、公共服务设施
任何与犯罪有关的行为也在特定的时间发生、构建“时间”类,依据日常行为理论和犯罪人心理研究[7]的归纳、嫌疑人选择作案的时间往往符合他自己的日常活动规律。犯罪时间所处的季节、每日中的时间段等会反映出犯罪人的职业、作案经验。每个犯罪行为都不是一瞬间能完成的,通过嫌疑人犯罪过程中犯罪行为的持续时间可以判断嫌疑人的作案经验、对作案空间的熟悉程度、心理状态、体能状况等。因此构建类如下:
时间
季节:春、夏、秋、冬
每日时间段:清晨:05:01-06:59
早上:07:01-08:59
上午:09:00-12:00
中午:12:01-13:59
下午:14:00-17:59
傍晚:18:00-18:59
晚上:19:00-23:59
凌晨:24:00-05:00
持续时间:长、中等、短
要描述一件事情、必须要有起因、经过、结果。在刑事案件中为了弄清案件本质必须查明案件类型、犯罪动机、作案手段。案件类型中主要列举了几种典型案例(例如:盗窃案、抢劫案、杀人案)。在侦查中将犯罪动机从需求性、心理倾向性、形成性三个方面来进行判断。作案手段的种类根据GA240.7-2000标准分为预备手段、侵入手段、暴力胁迫手段、窃取手段、利用计算器手段。据此构建类如下:
案件
犯罪动机
案件类型:盗窃案、抢劫案、故意伤害案需求性:图财、发泄情绪
心理倾向性:报复、妒嫉、逞强形成性:临时起意、一时激情、事先预谋、犯罪惯性作案手段:预备手段、侵人手段、暴力胁迫手段、窃取手段、利用计算机手段
依据犯罪嫌疑人特征,构建“经济状态为”、“婚姻状态为”、“文化程度为”、“前科记录为”、“人际关系为”、“心理气质为”、“犯罪心理结构为”、“惯用伎俩为”这些对象属性,将嫌疑人与各特征类中的子类也就是具体状态关联起来。
依据涉案物的特征,构建“来源于”、“种类为”这两个对象属性,将涉案物与各特征类中的子类关联起来。
依据地点的特征,构建“POI类别是”、“地点犯罪性质为”、“地点社会性质为”这三个对象属性,将地点与其特征类的状态关联起来。
依据时间特征,构建“季节是”、“每日时间段为”、“持续时间长”这三个对象属性,将时间与其特征类中子类关联起来。
依据案件特征,构建“案件类型为”、“犯罪动机为”、“需求动机是”、“心理倾向动机是”、“形成性动机是”、“作案手段为”这些对象属性,将案件与其特征类关联起来。
通过构建“在(某地)”、“在(谋时)”、“犯”、“搭乘”、“使用”、“带走”这些对象属性将“人”、“物”、“时”、“空间”、“事”这五个要素关联起来。具体属性构建如表2:
表2 对象属性定义
</owl:Class>
<!--http://www.semanticweb.org/a7/ontologies/2018/7/unti⁃tled-ontology-51#Cash-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Cash">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#Types_of_boo⁃ty"/>
</owl:Class> <!-- http://www.semanticweb.org/a7/ontolo⁃gies/2018/7/untitled-ontology-51#Daily_period-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Daily_period"/> <!--http://www.semanticweb.org/a7/ontologies/2018/7/untitled- ontology-51#Dangerous_heart-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Dangerous_heart">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#structure_of_criminal_mind"/>
<owl:disjointWith rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#Dangerous_per⁃sonality"/>
</owl:Class>
<!--http://www.semanticweb.org/a7/ontologies/2018/7/unti⁃tled-ontology-51#Dangerous_personality-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Dangerous_personality">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#structure_of_criminal_mind"/>
</owl:Class> <!-- http://www.semanticweb.org/a7/ontolo⁃gies/2018/7/untitled-ontology-51#Financial_Services-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Financial_Services">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#POI_value"/>
</owl:Class> <!-- http://www.semanticweb.org/a7/ontolo⁃gies/2018/7/untitled-ontology-51#Injury_case-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Injury_case">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#case_type"/>
</owl:Class> <!--http://www.semanticweb.org/a7/ontolo⁃gies/2018/7/untitled-ontology-51#Jewelry-->
<owl:Class rdf:about="http://www.semanticweb.org/a7/ontol⁃ogies/2018/7/untitled-ontology-51#Jewelry">
<rdfs:subClassOf rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#Types_of_boo⁃ty"/>
<!--http://www.semanticweb.org/a7/ontologies/2018/7/unti⁃tled-ontology-51#crime-->
<owl:ObjectProperty rdf:about="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#crime">
<rdfs:subPropertyOf rdf:resource="http://www.w3.org/2002/07/owl#topObjectProperty"/>
<rdfs:domain rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#suspect"/>
<rdfs:range rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#crimnal_case"/>
</owl:ObjectProperty> <!--http://www.semanticweb.org/a7/ontologies/2018/7/untitled- ontology- 51#has_Daily_peri⁃od-->
<owl:ObjectProperty rdf:about="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#has_Daily_peri⁃od">
<rdfs:subPropertyOf rdf:resource="http://www.w3.org/2002/07/owl#topObjectProperty"/>
<rdfs:domain rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#time"/>
<rdfs:range rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#Daily_period"/>
</owl:ObjectProperty> <!--http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#has_POI_Type-->
<owl:ObjectProperty rdf:about="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#has_POI_Type">
<rdfs:subPropertyOf rdf:resource="http://www.w3.org/2002/07/owl#topObjectProperty"/>
<rdfs:domain rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#location"/>
<rdfs:range rdf:resource="http://www.semanticweb.org/a7/ontologies/2018/7/untitled-ontology-51#POI_value"/>
依据本体理论中的类、属性、关系等要素,从书籍、电子资源、专家大脑中抽取出与视频图像侦查中侦查研判有关的概念,并将概念分类对映本体中的各要素,从而构建一个视频图像侦查领域的本体模型,可以让只有人能理解的知识变成机器可以处理的知识,这有助于研究机器取代人去进行侦查研判的工作。