>> 您的位置:首页 > 环球安防 > 产品标准 > 正文
一种警务情报分析框架技术的实现
2014/5/22 11:12:00      来源:《中国安防》    作者:樊少华 钟鑫
  摘要:目前,警务情报的运作主要依靠侦查员在犯罪调查中对信息的搜集、理解和加工,这项工作往往漫长而又耗费精力。本文提出了一种警务情报分析框架(PLAF)的实现方式,该框架能够自动处理从目击者陈述中提取的信息,以识别事件中的实体,为警察勤务提供一个完整、准确的情境图,进而提高态势感知并支持决策过程。本文概述了处理情报信息所面对的困难,着重研究了处理这些困难所应用的方法,总结了用于案发后警务分析系统方面的理论综述。最后,本文运用一个实际的警务调查案例来演示该系统的运用过程。

  摘要:目前,警务情报的运作主要依靠侦查员在犯罪调查中对信息的搜集、理解和加工,这项工作往往漫长而又耗费精力。本文提出了一种警务情报分析框架(PLAF)的实现方式,该框架能够自动处理从目击者陈述中提取的信息,以识别事件中的实体,为警察勤务提供一个完整、准确的情境图,进而提高态势感知并支持决策过程。本文概述了处理情报信息所面对的困难,着重研究了处理这些困难所应用的方法,总结了用于案发后警务分析系统方面的理论综述。最后,本文运用一个实际的警务调查案例来演示该系统的运用过程。
  关键词:警务情报犯罪调查证人证言

  引言
  在调查犯罪行为的过程中,警务研判人员需要证实所涉及到的实体以及他们之间存在的关系。这类情报的研判需要发现、了解事件中不同实体(比如:人、车辆、位置)间的关系。因此,研判人员尝试去了解证据,判定个体间联系并发现线索。需要开发一种能够满足警务情报工作的分析框架来满足分析研判的需求,该项工作所面临一个最大的挑战就是如何处理基于人的观察结果,比如在调查中撰写的案件调查报告、询问笔录和举报人报案记录。就其本质而言,这些数据只是主观评定的结果并且带有描述模糊性和不确定性。本文提出一种利用改进方法的系统实现方式,该方法不仅能够提高情报分析研判的效率同时还能提供态势感知,最后本文通过一个警务调查的实例来具体阐述该系统的功能。
  本论文由三部分构成,第一部分讨论了警务情报研判在处理通过人工观察得来的数据中所存在的问题,并且介绍了如何运用实体匹配方法解决这些问题;第二部分详细介绍了态势评估和实体关系图的使用方法;第三部分阐述了实现方案的具体方法,同时给出了一个如何运用该系统提高态势评估和决策支持的警务研判研判实例。

  一、实体匹配
  在警务调查中,情报信息工作通常是指侦查员对情报的搜集、记录和理解说明。人类天生具有发现、总结逻辑关系和推断的能力,而只能测量实体特征和部分属性的传统电子传感器不具备这样的功能。然而,如果引入人体传感器也可以产生一些值得研究的问题。人类的判断和评估很容易产生错误、偏差和不准确性,当一个目击者向警察描述犯罪分子身高时,很容易将一个实际身高为1.72米的嫌疑犯描述成1.77米,这种不精确性是正常的也是意料之中的。目击者也可能给出一个具体的范围,比如身高在1.7~1.8米之间,或者说"嫌疑人中等身材"或"比我稍微高一些"之类的表述。和处理这类信息或从信息中提取有用的情报相比,建立该问题的解决方法更为重要。通常个体差异和文化特征等原因会导致两个目击者提供的陈述出现矛盾和分歧。
  实体匹配是一种能够实现人类对单一实体模糊描述和该实体精确描述完美结合的过程,同时将融合准确性的这种特殊描述和已知实体数据集进行比较。一个实体可以有若干种类,实体可以是人或车辆,这些实体可以使用离散值来表示(如:福特、掀背式小车、4门),或者使用连续值来表示(如:1.7~1.8米,60千克),通常将描述性词语映射到一个连续数值空间(金发、身高、体重)能够有助于该实体的描述。当构建一个能够将描述的实体和实际实体作比较的系统时,要充分考虑使用模糊语言描述确定实体的似然性。在数据整理过程中会出现很多问题,如模糊性、准确性、可靠性、可信性和确定性。这些指标虽然差异不大,但是都非常重要,在进行数据处理的时候都必须考虑在内。在处理人类描述的数据时,最重要的一项就是如何处理描述的模糊性。鉴于众多的影响因子,建立一种能够解释影响因子的实体属性比对方法的机制是非常必要的,此外,还需要做属性比较和属性的聚类。
  信息融合技术可以通过实体描述整合的方法来实现实体匹配。信息融合方法主要是通过信息整合的思路来实现整合后的输出信息拥有更多的完整信息量。通过融合多个目击者对单个实体的描述,可以减少描述的主观性和前后关联性。可传递信度模型的变异模型能够减少解决实际问题过程中通常遇到的问题,可以提高其可用性。该模型能够将某个实体的多个描述融合成单个更为精确的描述,为我们提供了一种仔细观察描述结果的可能,同时帮助我们判定那些相互矛盾的线索。例如,某位目击者确实看到了某个单独的实体并且针对这件事情做了汇报,但目击者可能在这些方面没有专长,或者是由于可见度较差等原因或者其它原因影响了汇报结果。上述原因可能影响了汇报结果,使得该目击者的报案笔录和其他目击者存在相互矛盾的地方,类似于这样的情报就应该被发现并剔除或对其作出相关的解释说明。该系统设计存在一个预先纠错的功能,该功能能够将目击者给出的容易和其它陈述互相矛盾的错误情报在分析前剔除,如果某个证人证言被剔除或者忽略,仍然可以利用其余的证人证言分析出结果。
  我们使用一个简单的以人为实体的匹配来具体阐述融合过程。3个目击者被告知对某犯罪分子提供证人证言,证人要提供犯罪分子的身高、年龄、体重以及头发的颜色等四项属性,同时记录犯罪分子的性别。将三个描述融合在一起可以得到一个关于该犯罪分子更为精确的单一描述,利用该描述和数据集合中的所有具有这些属性的个体进行比对。也就是说,该犯罪分子的真实特征属性被映射到一个含有10000名个体的数据集合中。通过将融合后的描述和数据集合中的所有个体进行比对后,匹配程度排在第三位的匹配值为0.7316(其中1代表了完全匹配,0代表完全不匹配),说明在这10000个个体中还存在其它两个个体和该犯罪分子有着很高的匹配度。经过测试几个数据集合的大小和进行个体数据集合比对,犯罪分子被确定在匹配度最高的四个人的范围之内。

  二、态势评估
  态势评估是通过清晰地呈现所涉及的对象是什么、他们之间有着怎样的联系、发生了什么事件,以及随着时间的推移态势是如何发展演变的,进而对现实环境现状进行评估的整个过程。警务情报分析框架(PIAF)工具可以协助研判人员在情报图中更快的了解操作环境,更进一步通过预测对案件因素有影响的事件,并确定该特定事件发生的可能性和相关成本,风险评估可以理解为将一个将操作图(operationalpicture)映射到未来的过程。
  实体关系图(ERG)能够为研判人员提供一个态势发展的全景图。研判人员依据组成实体以及它们之间的相互关系,能够对现状进行一个快速的判读。ERG能够自动提取有关案件的情报。所涉及实体(如人、地点、车辆)的可能匹配是利用前面所提到的实体匹配算法来实现,这将有助于研判人员对嫌疑人的判定,加快研判过程。
  图1给出了一个如何生成ERG的例子。调查案件为一起盗窃案,目击者描述了嫌疑犯和逃逸车辆的一些特征,依据证人证言,利用第二节所阐述的实体匹配方法,研判人员给出了可能的嫌疑人表单。依据匹配度对每个个体匹配进行排序,嫌疑人1的匹配度为0.8(1代表完全匹配,0代表不匹配),嫌疑人2和嫌疑人3的匹配度都是0.7。

                       
                                   图1 一个简单实体关系图

  用类似的方式可以得到车辆的描述,图中也给出了和车辆数据库的最优匹配。下一步将要评估车辆所有者和目击者描述的嫌疑人是否有关联,同时对这一关联进行相应的打分。依据这种方式实体图,可以在研判人员的监督和指导下形成,这一半制动的过程能够使研判人员排除和其不相关的关联,同时选择他们所关注的实体。和人工方法相比,这种方法降低了人为失误的可能性,同时也可以降低误删除较好匹配和忽视重要信息的可能性。最后,由研判人员和系统做出的所有决策将形成电子记录,这种方式不但有助于对最终分析结果的研判,同时也可以也可以为案件审核提供一个有效路径。

  三、系统架构与实现
  依据第二节提出的融合算法,第三节中的态势感知工具将作为一个原型系统来设计和实现。本节将具体介绍该系统的架构和实现的细节,同时用一个小例子来介绍该工具的具体应用。
  (一)设计和实现技术
  PIAF架构在设计时必须考虑到灵活性和可扩展性。由于该系统要支持大型数据库和多个分布式客户查询需求的实时连接,该架构必须满足客户端和服务器组件日益增加的需求而不断演变。图2给了PIAF的架构图,从根本上讲,系统的融合能力是由一个服务层来支撑,在整个网络中该服务层包括一个或者多个分布式服务器,服务器的主要功能如下:
  (1)保存具有计算实体匹配功能的融合算法。
  (2)支持存储通过融合算法得到的信息和情报、融合或被融合存储的计算结果等相关数据源。
  (3)提供结构部件来支持上述的功能以及能够通过一个网络连接访问上述功能的接口。

                       图2 警务情报分析框架架构

  单个或多个客户端将利用服务器的公开界面来访问PIAF的融合功能(权限),一个客户端通过图形用户界面(GUI)与用户实现交互。通过图形用户界面,用户在实现系统所有主要功能的同时还规避软件本身的复杂性。为了清晰表示系统构架图,同时强调设计的效果,作者在图3中有意简化了设计框架提纲。伺服元件的核心采用JAVA中的商业应用组件技术(EJB),和提供分布式、事务性、安全性、便携性等基于JAVA技术的应用等。考虑到服务器端集群和负载均衡,组件必须驻留在一个数据库服务器内部。最后,在整个网络技术上考虑到松散耦合的客户端/服务器、分布和位置的灵活性和独立性,选择的客户机-服务器通信技术应该是网路服务技术。
  (二)原型和例子
  原型客户端也是利用JAVA技术来实现的。在本节中,笔者使用屏幕截图用来说明警务研判人员使用该系统来分析一个盗窃案的态势识别。
  
图3所示的客户端的全屏截图由四部分组成:实体检索(右上角)、检索结果(右下角)、ERG展示(左上角)、实体和关系信息(左下角)

  
               图3 警务情报分析原型:案件初始搜索

  在图3中,分析研判人员首先检索发生在特定时段的案件。需要注意,每个实体及其参数都是可以获得的。基于对事件结果简单的描述,研判人员从列表中选择一个案件,如一个盗窃案,并在ERG版面内展现和该案件有关的ERG。这些展现的ERG可以提示研判人员目前有若干报告、人、地址、车辆等信息和所要研判的盗窃案有关。在一个特殊的案例中,有两份目击者报告描述了案发现场中的嫌疑人,报告用黄色闪电型的文件图标来标注。当选择一条描述时,关于嫌疑犯的模糊描述将在窗口的左下角显示出来。
  然后,研判人员可以研判所选目击者描述的特征是否能在警务数据库中寻找到相匹配的人员。通过点击在ERG中的描述图标,实体匹配过程将在服务器端对数据库中的所有人员进行匹配度计算。基于融合算法并根据似然性对匹配进行评分,同时匹配结果将返回客户端并在ERG图中呈现出来。在图3中,唯一匹配的人员是GraceThomas,其匹配度为69.8%,相关信息返回客户端并反映在ERG中。研判人员通过对第二个目击者描述的匹配(在图2中黄色箭头所指向的)认定了该结果。表1同时给出了两个目击者的描述以及GraceThomas的真实特征。

  
                        表1 两位目击者描述以及嫌疑犯真实特征


                    图4 扩展ERG来论证犯罪嫌疑人的其他犯罪活动

  通过扩展ERG中不同实体间的已知关系来判定到他们之间的内在联系。在图4中,研判人员拓展来GraceThomas的关系图,同时发现她曾经因另一起盗窃案被判刑,这将引导我们对该嫌疑人进行深入调查同时给出了犯罪分析的线索。
  该案例演示了如何将情报加工处理运用于案件调查、提高情境感知并协助决策。如果没有使用该系统,研判人员不得不阅读冗长的案件记录和报告并在海量的数据库间进行手工搜索。手工搜索的过程很容易出现人为错误,并且重要信息都很容易丢失。同时,手工搜索过程往往需要几天甚至几周的时间来建立一个精确地操作界面,同时,表达的准确性在很大程度上还依赖于研判人员的技能和相关经验。因此,本文所提出的系统能够有效减少研判人员的计算量,也能够避免研判人员在进行分析研判时不用将大量时间和精力花费在处理过载数据上。

编辑:侯雨婷
注:本文版权归《中国安防》杂志社和《中国安防》杂志网所有,任何媒体或个人未经书面授权严禁部分或全文转载, 违者将严厉追究法律责任。更多详情请订阅《中国安防》杂志。