>> 您的位置:首页 > 环球安防 > 技术产品 > 正文
美国国家标准技术研究所生物特征识别技术评测概览
2014/10/8 14:20:00      来源:《中国安防》    作者:赵洋
    近年来,生物特征识别技术发展十分迅猛,各种识别系统的准确率较以前有了大幅度的提高。为了更好地了解当前生物特征识别系统的性能和不足,以美国国家标准技术研究所(NIST)为主的国外政府机构和高校自上世纪90年代起,进行了多项生物特征识别技术评测,涵盖了指纹识别、人脸识别、虹膜识别等识别率相当高的技术,吸引了世界多家知名企业、院校和个人参加。本文将全面介绍美国NIST的生物特征识别技术评测项目,以供科研人员参考借鉴。

  【关键词】生物特征识别评测人脸识别指纹识别虹膜识别NIST

  一、生物特征识别技术的发展现状
  生物特征识别技术利用人类个体的生物信息进行身份认定,具有安全、可靠、准确、易于实现自动化管理等优点。生物特征识别技术的日益成熟和传统身份认证方式的限制、使用不方便性(如密码)成为过去几年生物特征识别市场高速发展的驱动力。同时,恐怖主义袭击、劫机事件和犯罪率的增加,也迫使各国政府加强安全防范措施。生物特征识别技术作为一种有效的身份认证手段,受到了各国政府的青睐。
  目前,全球实施的与生物特征识别有关的项目包括电子护照、欧洲的视觉系统和自动化计划以及一些国家推出的身份证计划,如印度身份证计划,都采用了生物特征识别技术,这成为了生物特征识别市场的主要驱动力。公共安全(边境控制、人口管理等)、互联网接入、金融交易等领域逐年增长的安全需求,同样也在推动着行业发展,增加了对生物特征识别技术的需求。按照技术分类,在过去几年指纹识别技术一直引领着市场的发展,但同时人脸、虹膜和静脉识别技术在全球的使用率也得到了很大增长。生物特征识别行业领先的咨询和技术服务公司——国际生物特征识别集团(InternationalBiometricGroup)的研究表明,至2014年全球生物特征识别市场将超过100亿美元,如图1所示。
    
                           图1全球生物特征识别行业年收益

  随着生物特征识别产业进入高速发展阶段,其产品的质量控制问题日趋重要。对系统的性能给出客观、准确的评估是一个比较复杂的问题,它受测试样本的数量、质量、评估指标等因素的影响,对用户来说该问题尤为重要。所以,生物特征识别技术评测已成为该领域的一个重要研究方向,越来越凸显出它的重要性。

  二、NIST生物特征识别评测项目
  从上世纪90年代起,NIST在国际范围内定期举办生物特征识别技术评测,在评估各种系统识别率的同时,也大大推动了生物特征识别技术的发展。这些评测主要分1:1比对和1:N比对两大类。1:1比对也称查验,是指判断评测数据集中的两幅图像是否采集自同一人,如判断两枚指纹是否来自同一人;1:N比对也称搜索鉴别,是指给定一幅图像,判断该图像与数据库中的哪一幅图像属于同一个人。
  1.人脸识别评测
  NIST组织了针对人脸识别供应商系统的评测——FRVT(FaceRecognitionVendorTest),至今已连续举办了FRVT2000、FRVT2002、FRVT2006、MBE2010和FRVT2013五届评测。这些评测一方面对知名的人脸识别系统的性能进行比较,另一方面全面总结了人脸识别技术发展的现状,并进一步指出了人脸识别算法亟待解决的若干问题。
  FRVT2002评测分为高计算强度(HCInt)和中等计算强度(MCInt)两种,其中HCInt测试使用的数据库为来自37437人的12万幅图像,所有图像全部由美国国务院下属的领事事务局签证服务处提供。MCInt测试使用的数据库包括室内、室外采集的图像,最长时间跨度为三年。基于这些数据,测试了身份认证、闭集识别、开集识别三类不同的人脸识别任务的性能。测试结果表明:自FRVT2000以来,室内图像的识别性能有较大的提高,但是室外图像的识别率仍然有待提高;在识别模式下,识别性能随数据库规模扩大而下降,数据库规模每扩大一倍,识别率约下降2到3个百分点;采用三维融合(morphIng)模型校正姿势变化,可以提高识别率。
  FRVT2006评测主要目标是针对最高水平人脸识别原型系统、算法及成熟的商业人脸识别系统进行评价,共有来自10个国家的22个单位参加。测试结果表明:与FRVT2002相比,静态人脸识别与3D人脸识别算法的错误率下降了一个数量级;不同光照环境下的人脸比对取得了进步。FRVT2006还第一次将机器识别效果与人的识别能力进行比较。结果发现,在不同的光照环境下,给定一个低的虚警率,七个自动人脸识别算法的性能相当于或优于人的识别能力;若不指定虚警率,则七个算法中的三个算法的性能相当于或优于人的识别能力。
  2010年并没有举行FRVT评测,而是进行了与之非常类似的MBE(Multiple-BiometricEvaluation)人脸识别评测,此次评测共有7家供应商和3所大学参加,用于评测的数据库规模超过了以往评测规模,首次达到百万级(180万),采集图像来自罪犯和签证照片,采集时间跨度超过10年。同时首次公布各个算法的识别准确率,并对算法的运行速度进行了测试。MBE2010评测中表现最好的为日本NEC公司的算法,在160万幅人脸图像(犯罪纪录中所截取)中搜索识别准确率达到92%,每次搜索比对所需时间仅为约0.4秒;在180万幅人脸图像(签证申请时采集)中,准确率则达到了95%。从这次评测结果来看,人脸识别技术有了非常大的进步。
  2013年,FRVT在前几次人脸识别供应商评测基础上继续进行,主要评测任务包括:在图像集中实施1:N人脸搜索鉴别、1:1的签证图像验证、视频序列中进行人脸识别、双胞胎识别、性别估计、年龄估计和姿势估计。从测评任务上,我们可以看到人脸识别技术已经向更加智能化发展,不仅仅是单纯追求识别的成功率,同时也反应了人脸识别与视频监控技术对接的发展趋势。到目前为止,NIST只发布了关于年龄估计的报告(世界上首份自动年龄估计算法性能报告),评测结果表明:在600万规模的数据库进行年龄估计(误差在5岁以内),最好的算法的准确率为67%,所有算法的运行时间小于0.15秒/图片,最准确的算法平均运行速度为0.125秒/图片。
  2.指纹识别评测
  在过去的十几年里,美国NIST进行了多项与指纹相关的评测,第一项叫做指纹模板2003(FingerprintTemplates2003,PFT2003),现在演变为PFTII,这是一项针对1:1匹配的评测,重点关注指纹识别算法的核心比对能力,并不进行1:N比对。细节交换项目(Minutiaeexchange,MINEX)始于2004年,同样是关注于1:1指纹比对的评估,其支持INCITS378标准。而指纹供应商技术评测(FingerprintVendorTechnologyEvaluation,FpVTE)关注的重点与前两者不同,这项评测进行的是1:N指纹搜索比对,目前该项评测于2003年和2012年举办了两届。由于1:N指纹搜索比对在警察、司法、海关等执法部门中有着广泛的应用,所以FpVTE受到了越来越的关注。
  FpVTE2003是由美国司法部通过NIST举办的第一届1:N指纹识别评测,该评测作为美国《爱国者法案》第403C条款的一部分,以证明生物特征识别技术可以被用于美国旅游与移民状态表示技术计划(US-VISIT)。此次评测共有18家参加单位,测试了34个系统。在评测过程中,要求各个参评单位使用自己的硬件和软件,并在NIST位于马里兰州的办公地进行组装和调试。测试数据来自美国联邦和州政府的多个指纹库,共有来自25309个体的393370枚不同的指纹图像。FpVTE2003测试结果表明:来自NEC、SAGEM和Cogent公司的系统识别准确率最高,这些系统对不同类型的图像和不同来源的数据都展现了很好的性能;指纹图像质量和手指数量对指纹识别系统的性能有很大的影响;采集仪并不是唯一决定图像质量的因素;对于不同类型的数据,准确率可能会发生巨大变化,只用一种类型数据进行生物特征识别系统评测是不足以测评或比较各个系统的;最准确的指纹识别系统的准确率远远大于人脸识别系统的准确率。
  FpVTE2003评测的数据集规模只有10万级,而NIST举办的1:N人脸识别、虹膜识别评测(MBE2010、IREXⅢ)的数据集早已达到百万级,所以在2012年NIST举办了测试数据集规模超过百万级的FpVTE2012指纹1:N搜索比对评测。FpVTE2012与FpVTE2003有很大的不同,不再使用参评单位自己的硬件设备和软件,而是统一使用NIST的硬件设备,并规定了软件的API,采用DellM905、M910、M605和M610四种计算刀片,所有的算法都在64位CentOS6.2系统上进行评测。测试数据来自FBI、DHS、LACNTY、AZDPS、TXDPS的指纹数据库和来自新型数据集的十指现场扫描图像、多指扫描图像、历史上非常重要的墨水印迹指纹图像,以及来自移动设备的指纹图像。与以往的评测相比,数据类型更加复杂、贴近真实应用。本次评测了评估算法的识别准确率、运行占用内存情况、模板尺寸、错误注册率、计算时间等指标,目前为止,NIST网站还未发布评测结果。
  3.虹膜识别评测
  虹膜交换(TheIrisExchange,IREX)是由美国国土安全部资助NIST进行的虹膜识别评测项目,目前已经举办了IREXⅠ、IREXⅡ、IREXⅢ、IREXⅣ、IREXⅤ和IREXⅥ六届评测,每次评测的目标和重点各不相同。
  IREXⅠ始于2007年底,其最初目的是为了使各个厂商的高性能虹膜识别系统之间能够支持虹膜图像集的互换,所以该项目被称为虹膜交换(TheIrisExchange)。包括剑桥大学、CogentSystem、CrossmatchTechnologies、Honeywell、Iritech、L1IdentitySolutions、LG、Neurotechnology、ReticaSystems和Sagem十家单位参加了此次评测,共计提交19个算法。由于在美国联邦的应用中需要使用标准格式图像以支持系统的互操作性,同时对图像进行压缩对于带宽有限的网络和存储来说是至关重要的,所以IREXⅠ制定了两个研究目标,一是研究了在保持识别率的情况下,图像可压缩到何种程度;二是公司间互换虹膜图像时,算法的识别率。在实施过程中,NIST首先联合这些单位制定和测试了标准图像格式,同时根据测试结果修订了ISO/IEC19794-6标准。研究结果表明:大小为30Kb的虹膜图像即可进行大规模虹膜识别应用;大小为3Kb的虹膜图像即可完成一对一的虹膜查验;各个虹膜识别算法在使用压缩图像时仍可保持它们的准确率和互操作性;虹膜识别是指纹识别之后第二个可进行大规模生物特征识别的技术。
  2010年,NIST又开展了第二项有关虹膜的评测——IREXⅡIQCE(虹膜质量标度和评估),该项目旨在定义和量化虹膜图像质量是如何影响虹膜识别准确率的,并根据研究结果制定《ISO/IEC29794生物特征样本质量——第六部分:虹膜图像》标准。共有9个供应商参加此次评测,提交了14个虹膜质量评估算法。研究结果表明:虹膜图像质量对识别率有非常大的影响,并建议未来首先要改进图像采集设备(如传感器的噪声);影响虹膜图像质量的因素包括:有效虹膜区域、虹膜瞳孔对比度、瞳孔形状、虹膜巩膜对比度、注视角度、清晰度、扩张度(瞳孔直径与虹膜直径比)、灰度值分布、虹膜形状、虹膜尺寸、运动模糊、信噪比。
  2011年,NIST正式开始了IREXⅢ评测,共有9家公司和2所高校参加,评估了95个算法,重点评测了算法的1:N搜索鉴别能力。与以往评测不同的是,IREXⅢ首次采用了应用级数据库进行测试,评测数据库规模较以往有很大提高,图像数量达到610万幅,分别来自221万个人的433万只眼睛。结果表明:识别率最好的算法在390万幅图像的数据库中进行搜索比对时,在1013次比对中只出现25次错误,识别率为98.3%。随后,NIST发布了《虹膜识别系统失败原因分析》报告,认为:“虹膜识别的理论准确率非常高,但和许多其他生物特征识别系统一样,高度依赖于样本数据的质量。虹膜遮挡、视轴偏离、图像模糊和虹膜旋转是影响识别的常见问题。IREXⅢ虹膜数据库存在部分质量差的图像,这导致了评估中算法识别性能的下降。对于单眼搜索,无论怎样合理选择阈值,比对算法识别率也超不过98.3%。”
  2012年,NIST又进行了IREXⅣ评测,本次评测的重点仍然是关注虹膜识别算法的1:N搜索比对能力,共评测了来自12个单位的66个算法。用于评测的数据库规模较上一届有了进一步的增长,达到400万幅图像,均采集自应用现场。评测结果表明:虹膜识别技术有了进一步的提高,有些算法在160万幅图像中进行单眼搜索比对时,只需不到1秒的时间(只使用一个处理核),并且错误率低于1.5%。最佳算法失败的原因基本上都是因为图像质量太差,如闭眼、视轴偏离、高度扭转等,而这些问题都可以通过更好的采集相机或更严格地控制图像质量而避免。
  前几次的评测结果表明,虹膜图像质量的好坏是影响算法识别率的主要原因。因此,2012年NIST开展了IREXⅤ项目,研究了应如何采集虹膜图像才可保证图像的质量,指出了操作人员应如何使用采集设备,但NIST并未发布相关报告。
  2012年,美国圣母大学(UniversityofNotreDame)的一项最新的研究表明,虹膜并不是终身不变的,它们容易受到机体老化的影响,会随着时间流逝而不断改变,从而影响虹膜识别的准确性。针对此项研究结果,NIST于2012年开展了IREXⅥ项目,主要关注了虹膜的老化问题,并于2013年6月发布了《虹膜识别准确率的时间稳定性》报告,研究结果与圣母大学的研究结果大不相同。NIST采用两个大的应用级数据库(人数将近100万,图像数量为135万,图像采集时间跨度达9年)进行测试,结果表明:并没有明显的证据证实虹膜老化效应;没有发现随着时间的推移,虹膜识别系统的准确率有所下降;但确有非常小的一部分人因为眼病出现虹膜匹配分数降低的情况。

  三、总结
  随着科技的进步,生物特征识别技术的性能有了很大提高,尤其是指纹识别、人脸识别和虹膜识别技术,目前这三种技术中最优秀的算法在百万级数据库中的识别准确率都超过了90%。各种生物特征识别算法的1:N鉴别性能得到进一步的提高,在数百万人中查找一个人将不再是大海捞针。针对生物特征识别技术的评测已经成为该领域的一个重要研究方向,对识别算法的评测,更成为了非常重要的一环。同时,对评测结果的分析研究,尤其是识别失败原因的研究更好地为现有系统或算法找出了不足,给生物特征识别技术的发展指出了方向。

编辑:侯雨婷
注:本文版权归《中国安防》杂志社和《中国安防》杂志网所有,任何媒体或个人未经书面授权严禁部分或全文转载, 违者将严厉追究法律责任。更多详情请订阅《中国安防》杂志。