计世网

旷视科技Face++——用端到端的行业方案助推安防智能化
来源:中国安防
2018-09-03
人工智能技术,尤其是人脸识别技术的应用与传统安防行业的结合,为安防行业升级打开了新的局面。

 

科学技术的发展日新月异。随着“监控全覆盖”以及“智慧城市”、“平安城市”建设的开展,安防大数据时代也露出了曙光。近两年,以人脸识别为代表的人工智能相关技术也广泛地加入到安防行业中来,“智能安防”的概念开始逐渐深入人心,越来越多的传统安防业务正在摆脱旧有模式开展应用新技术。

技术务实 价值创新      

旷视科技成立于2011年,因拥有全球最大的人脸识别云平台 Face++ 而被人熟知。作为国内领先的人工智能产品公司,旷视科技可以通过提供云端 API、离线 SDK ,为广大开发者提供人脸检测、人脸属性分析、人脸比对等免费的人脸识别底层技术,如今 Face++ 已成为了全球超大型的人脸识别云平台之一。但是很快旷视就意识到,要推进技术商业化必须实现技术与应用行业的深度结合,能够解决行业中实际的问题才能发挥出技术创新的社会价值。

而人脸识别和安防行业有着天然的结合点,首先,每个人的面部特征都是独一无二的,因此人脸能够作为一种重要的身份识别标识,在公安机关各警种业务中起着举足轻重的作用,如日常巡更、户籍排查、入出境管理和刑事案件侦查等警务中,都会通过辨识人脸来核实相关人员的身份;同时,安防行业中的海量视频监控数据也为人脸识别算法训练提供了温床。

2015年,旷视科技正式组建安防团队,并着力于用深度学习和智能感知技术全面挖掘安防数据的价值,致力于为公共安防提供端到端的解决方案。区别于传统的安防企业,旷视科技在安防行业中的实质角色是为公共安防网络和终端赋能,利用自身在视频结构化、图像语义分割方便的技术优势,帮助公安在视频及图像内容检索中提升效率。

传统的刑事侦查方法和工作思路往往都是通过人力调查取证,查阅海量的视频监控数据往往会造成大量的时间和警力的浪费;而现有的图侦应用亦具有很大的局限性,对图像特征的提取能力较低;此外目前主流的安防制造商尚未提供出可应用的实战级产品和系统化的解决方案。基于这些行业诉求,旷视研究院利用核心的算法优势结合视频智能分析和安防中的大数据,推出了一系列的智能安防硬件产品和解决方案,以解决现代安防中的复杂多变的现实问题。

然而和实验室的理论环境相比,人脸识别在真实的应用场景中具有十分的挑战性,尤其是在人流量密集的安防应用场景。因为无论是周边环境的变化(如场景中的光线、遮挡、角度、位置等因素)还是人自身面部特征的变化(如目标人物的衣着、妆容、表情等)都会对人脸识别的识别准确性造成一定的影响,如何将这些外部因素的影响降到最低就是旷视研究院深入安防应用场景的研究方向,在短短的一年之内,为给安防行业提供稳定性和鲁棒性更强、跟踪速度更快的技术支撑,旷视针对不同用户的特性场景和业务需求进行了10多次算法升级和环境优化。

此外,为将人像的比对识别更灵活、更节省成本地融合到公安现有的业务平台中,旷视安防业务团队组建了一支专业的解决方案顾问小组,成员均为具有超过 10 年公安和安防行业经验的老兵,能够贴合公安系统的人像应用需求提供切实可行的产品化的建设方案。

端到端智能安防产品系列      

出于实战导向,旷视科技结合公安行业的应用需求将适合智能安防市场细分为以下几个典型应用场景,并基于以上场景构建了“云+端”架构的人脸识别服务矩阵型系列产品。

1. 以高速卡口、加油站、边防检查站等为代表的强管控卡口;

2. 以地铁站、火车站、客运站、景区为代表的人群密集且易丢失目标的重点场所管控;

3. 世界级、国家级重大活动人员管理和安防保障;

4. 综合及群体性维稳事件处理;

5. 社区出入管控;

6. 社会面综合人像卡口改造。

通过自研智能感知前端和智能云服务的结合来为不同警种和安防场景提供模块化部署,旷视的“云+端”智能安防行业解决方案可对公安网的七类重点人员和三逃人员进行重点布控。

在大场景实时视频流分析的应用中,想要实现高效人像识别比对的真正瓶颈往往不在于算法,而是在于系统对海量计算的处理能力和响应速度。随着城市数字化的发展和监控路网的延展,传统基于 CPU 或 DSP 通用编程平台的传统分析已无法满足公安的警务处理需求,因此行业亟需基于 GPU 或者高密、分布式可扩展的高性能服务器为安防大数据的应用提供运算支撑,另一方面也催生了智能化前移和云端集中管理的行业趋势。

继2015年发布全球首款智能摄像机 MegEye-C1 之后,旷视科技在2016年又集中发布了 物联网图像采集终端 MegEye-C2、智能人像抓拍机 MegEye-C2S、智能客流统计终端 MegEye-D1 等多款前端智能化硬件产品。而为了降低后端服务器的损耗提升安防系统的整体效能和计算力,2017年,旷视推陈出新,尤其针对大规模人流量的场景设计研发了可在前端实现智能识别和数据结构化的终端应用,其中包括前端的高清智能采集单元、设备端的前置计算单元以及顶端的智能视频综合分析平台。

感知前端-全帧抓拍机 MegEye-C3S

经过对行业需求的深刻分析,2017年9月旷视科技组织开发了新一代的全帧智能人像抓拍机——MegEye-C3S。基于最先进的 FPGA 技术,旷视将核心的人脸检测、视频结构化技术嵌入摄像头内,使 MegEye-C3S 自身就具备人像捕捉和智能分析的能力的同时大量节省计算资源,作为一款高清智能摄像头,MegEye-C3S 具备丰富的接口,可以很容易地与其它子系统进行整合,从而大大提升了系统集成效率。

在应用场景定位上,MegEye-C3S 可以服务于所有安防人像卡口业务,特别适用于人流密集的通道、出入口等场景。拥有感知能力的前端摄像机是安防体系的视觉传感器,他们具备独立识别和分析的能力,就像遍布在城市中不间断进行巡逻的治安员。

MegEye-C3S 产品构造

作为旷视科技 MegEye 系列最新产品,MegEye-C3S 智能人像抓拍机具有以下亮点:

▋ 全帧率、全画幅 抓拍率>98%

首先,MegEye-C3S 在核心的人脸抓拍功能上取得了重大突破,能够超越目前市场上所有人像抓拍机做到对视频流全帧率、全画幅的人脸检测与抓拍。在 1080P 高清视频格式下, C3S 支持高达 30 FPS 全帧实时人脸检测,每帧最多可抓拍出 100 张以上的人脸照片,抓拍率不低于 98%。

▋ 多维判断 正脸率≈100%

同时,旷视科技也对新一代智能人像抓拍机 MegEye-C3S 的人脸识别算法进行了全面优化,不仅可以进行逐帧的人脸检测,还能逐帧对每张人脸进行多维度的质量判断。在对出现在视频中每张人脸质量综合评分后,C3S 能推送每个人在整个轨迹中角度最正、最清晰、质量最高的人脸,大大提升了数据的可用度与依据力。

▋ 智能过滤 重复率<10% 

重复抓拍是目前智能人像抓拍机在实际应用过程中不可避免的现象,这主要是由于实际场景中人群的相互遮挡,人员长时间逗留,移动规律不定等原因而致。对此,C3S 实现了在运动预测的基础上结合特征识别的智能分析,能有效过滤掉重复人脸数据,在复杂场景中将人脸重复抓拍率控制在 10% 以内,从而大大节省后端计算资源的浪费。

▋ 前端智能 半结构化输出

MegEye-C3S 还支持对识别人员的属性标注,输出年龄段、性别、出现时间等信息,输出人脸以外的更丰富的人员特征信息。而相较于市面上其他同类型产品,C3S 最大的优势则在于对少数民族和不同种族人群的识别能力有了较大的提升。

设备端-前置计算单元 MegBox

传统的庞大的公安系统往往需要部署大规模的服务器,然而囿于计算量的限制,行业亟待更小更快速的计算模型和处理单元以分担后端服务器的压力,针对这一需求,旷视开发出了一款能够将计算单元前置的“盒子”——MegBox。

作为一款基于 NVIDIA Tegra X1 开发的高性能人工智能算法处理器,MegBox 具有 Teraflops 级的浮点计算能力,能够流畅运行旷视自研人脸识别算法,可实时解析 1 路普通摄像机或 4-6 路抓拍机的视频数据。用户可以通过系统提供的 API 接口,直接调用系统算法 ,也可以通过 MegBox 对实时监控视频中出现的人进行人脸检测和抓拍,此外 MegBox 还能够满足办案人员在更深次的安防业务中的实际需求,如人像识别、比对,黑、白名单实时告警提示等。

在应用中,MegBox 的创新价值主要体现在:

▋ 解决机房服务器堆叠问题

前置的计算单元 MegBox 在方案中的应用相当于轻量化服务器端数量。例如以往每台后端服务器只能处理 10 路摄像头的数据,而当 MegBox 承担了大部分人脸计算后,每台服务器便有了更充足的计算空间可以解析 200 路实时视频,尤其适用于通道、社区、街道卡口等场景中,可大幅提升区域监控系统整体效能。

▋ 解决网络不稳定、网络带宽受限时的数据回传问题

在传统的视频监控系统架构中,往往会因网络欠佳导致前端摄像头的实时视频无法通过视频专网回传到公安网,从而给案件侦查造成盲区,但是 MegBox 的应用可以保证在前端存储 30 天抓拍告警数据,不错失任何一帧关键画面。

▋ 解决采集设备在移动的情况下,无法识别比对报警的问题

在重点活动或重点场景中通常需要侦查民警在现场进行临时布控,并通过移动侦查设备(如巡逻警车车载箱、公交、营运大巴车载箱 、室外监控立杆设备箱等)来实时回传视频数据,采集前端和前值计算单元的结合可以让系统在移动条件下也能够进行精准识别和比对报警(移动场景下,MegBox 可通过无线网络传输数据)。

顶端- ReID 跨摄像头识别综合应用

不可否认,视频是蕴含数据信息最丰富的一种信息资源,尤其是对于安防行业来说。然而大众对人像识别技术有一个普遍的误区,认为人像只能识别比对人脸而忽略了人像的其他一些特征,实际上,人像除了面部特征,还包括性别、年龄、发型、肢体、衣着颜色、穿戴特征、行为状态等特征,这些特征在安防场景中往往是侦破案件的关键线索和突破口。

但是目前安防行业的智能化水平仍处在较低的阶段,大多数监控系统在警务中充当的角色只是记录的功能,系统自身无法挖掘出视频中的数据金旷。作为一家以计算机视觉技术为核心的智能行业解决方案提供商,让机器“看懂”图像是旷视的使命。针对环境复杂的城市安防综合管理,旷视提出了 ReID 跨摄像头识别方案,利用大数据结合视频分析技术和深度学习,通过对大量视频数据中不同属性的事物进行标注来教会系统区分画面中的人、车、物、案四要素,以在合成作战中最大效能地发挥系统平台优势,节省警力和时间成本。

ReID 应用的前提是对视频的智能分析和结构化处理,也就是通过技术将视频内容中的重要信息组织成可供计算机和人理解的文本信息或可视化图形信息,并进一步转化为公安实战所用的情报,实现视频数据向有效情报的一次转化。尔后,通过以点带线,以线带面的方式将各个区域范围的视频采集单元进行串联,便可实现跨摄像头的检索与追踪。

图为旷视科技对一开放街区监控进行的实时视频分析,系统可以清晰地分辨出行人的性别、发型、穿戴特征、衣着颜色,甚至是否骑车等特征,同时还包括街道上的车辆情况。根据这些标签,旷视能够帮助公安机关提供更多维度的数据信息,通过综合管理平台,办案民警可以输入一些关键词如“女性”、“15-25岁”、“红色上衣”、“背包”等关键特征就可以快速调取到一名失踪女孩的出走轨迹。

安防行业应积极建立以人脸数据为起点的大数据中心。旷视科技安防业务负责人提出建立“一脸一档”的大数据挖掘平台,以针对重点布控人员和黑、白名单进行动线追踪。和单点监控相比,ReID 方案通过多组摄像机的抓拍记录及人员比对让安防工作变得更为立体,方便办案民警对目标嫌疑人的行为轨迹、出行规律进行分析,进而为案情线索和实施灵活布控打击提供依据。

结语      

通过将视频数据进行结构化识别存储,和实时的识别分析,旷视的解决方案大幅提升了公安的实战效率。截至今年9月,旷视的人脸识别系统已在公安部及全国大几十个省市落地,在帮助地方公安干警查案、办案和精准投放警力上起到了积极的作用,促进了公安业务飞跃式的发展。

以地铁场景为例。地铁是城市流动的血液,但也是犯罪分子浑水摸鱼的最佳之选。2017年7月,旷视科技Face++ 与某市轨道交通分局共同开展了人脸识别系统反恐快反体系试点工作。系统的上线大大变革了分局巡防工作的时空覆盖面和效能,不仅推动了分局警务模式的变革和战法的升级,也为公安干警带来了二等功的荣誉。目前,旷视的人像卡口已经在各地都取得了可观的战果。

而在世界级的重点涉外活动中,旷视的技术特长也发挥的极大的优势。2017年9月3日-5日,金砖国家领导人第九次会晤将在福建厦门举行,旷视受命为金砖成立了安保项目小组,首次实现了公安部和地方公安系统的部地联调工作,保障了会议顺利举行。项目期间,公安部及厦门市等政府重要领导对项目组进行了视察,会后,旷视的智能安防产品和工作人员的专业精神得到了国家反恐领导小组的高度肯定。

人工智能技术,尤其是人脸识别技术的应用与传统安防行业的结合,为安防行业升级打开了新的局面。随着产业化发展和技术成熟度越来越高,结构化的人脸数据有望成为构建平安城市、智慧城市的基础数据之一。

10月29日-11月1日,第十六届中国国际社会公共安全博览会将于深圳会展中心举行,届时旷视科技也将携最新智能安防产品亮相,敬请关注。

责任编辑:何周重