即时新闻:
新闻

成为“福尔摩斯”不是梦,大数据技术是关键

2016年11月24日 18:00    来源:中国警察网   作者:辛闻   


  
  中国警察网:近两年,“大数据”成为业界和学界“舌尖上的热词”,如何利用大数据正确挖掘价值?大数据落地实践又为“智慧警务”建设带来什么样的改变?中国警察网邀请到北京明略软件系统有限公司副总裁,中关村大数据产业联盟安委会主任唐日新,来和我们一起聊聊“大数据在公安领域的实战应用”。2016年9月8日,明略数据发布了SCOPA2.0。SCOPA发布一年多的时间,在全国各地公安机关与不同的警种合作,在实际的应用中,唐总有什么可以给大家分享的?

  明略数据唐日新:我想跟大家分享跟第一线的公安机关在共同协作过程当中那种最切身的体会。老百姓遇到任何的情况,第一时间会想到有问题找民警,无形当中给咱们第一线的公安民警增添了巨大的工作压力。比如说,咱们经常看到一些影视作品中描述,民警一个月两个月不回家这种情况经常出现。在这种情况下,如果我们不能够很好地去运用科技的手段,把线索、案件去梳理好,发掘彼此之间的关联或者关系,就完全变成靠人工的方式去排查、去跟踪,这样对我们民警的工作压力就会非常大。在这个过程当中,我们运用大数据技术,通过全量数据采集,在很大程度上就帮助公安机关,对一些用人力在非常长的时间内要去梳理的线索进行加工整理,然后整合出相对而言比较有规律、易追踪判断的证据库、线索链,帮助了咱们公安机关和基层民警,提升了工作效率,也很大程度上震慑了犯罪。

  中国警察网:大数据破案与传统的破案思路和方法有什么主要的区别?

  明略数据唐日新:咱们公安机关积累了非常多,也非常好的方法论、战法等等,这些是需要传承的。我们希望能够把这些方法、经验通过科技的手段沉淀下来,也能在各个领域、各个层次去复用。另一方面,人脑有一定的限制,也会容易出错。在实际办案过程当中,嫌疑人的可疑现场是很多的,嫌疑人可能有非常多的选择:可能是非逻辑性的选择,也可能是发散性的选择。如果我们去设定侦办方向或者思路,方向可能是天文数字。通过明略数据大数据解决方案或者产品,能够根据可评估可追溯的方法,把破案思路进行优先级的比对,再指导我们民警逐一去排查。有海量数据做支撑,我们整个公安工作的方向就会更加清晰。系统可以把人的经验转化成数理逻辑,同时用数理逻辑来补充人所疏忽的方面,可实现天网无缝覆盖。

  中国警察网:目前大数据行业落地的真正挑战是哪些方面?

  明略数据唐日新:咱们国家的数据质量,在某种程度上来讲,有些地方还是有问题的,没有非常高质量的数据源。从我们公司创立的那天开始,就致力于通过高效的数据治理方法和产品,使我们把比较凌乱的数据先治理好,从而让各种各样的结构化数据、非结构化数据,各种类型、多个警种的数据,甚至全部警种的数据,能够很顺利地纳入到我们的体系中来,就可以实现数据之间的互动。我们在这个过程中,就能挖掘很多的关系、价值。所以说,我们面对的比较大的挑战之一就是要把数据治理做到扎实。

  中国警察网:明略数据强调大数据的本质与核心是:关系挖掘。明略数据又是如何做到对海量数据的关联和分析?针对以上,有哪些产品?

  明略数据唐日新:大家都知道,做大数据,一方面是对海量数据的处理,更重要的一部分就是算法。你的模型是否是高效、准确,这是做大数据最核心的部分,它是一种知识密集型的产业。明略数据积累了大批在数理逻辑方面的国内外顶尖的专家和人才。我们曾经整建制地去挖过国内外在开源领域和数据挖掘领域非常有造诣的团队,我们拥有大批的算法工程师和建模工程师。利用这些专家人才的智慧,我们针对解决不同的问题开发了相应的产品,比如我们有军工级别的安全大数据平台MDP,把海量的数据汇聚到这个平台上,实现对这些数据整合。在这个基础上,我们有针对关联分析、数据挖掘平台类的产品叫做Datalnsight。这些平台都是凝结了我们算法工程师、建模工程师的心血在里面。同时,在关联分析方面,我们新发布的SCOPA2.0版产品既融合了关系挖掘算法模型的引擎,又融合了很多积累下来的行业经验、战法的模型。我们还根据实际的环境,做了非常简洁清晰的展示的环节,能够让大家看透这些数据背后的端倪。

  中国警察网:明略数据运用于公安行业的大数据解决方案有自己什么样的特点或优势?落地实践于公安领域,为“智慧警务”的建设带来什么样的改变?

  明略数据唐日新:在这个领域当中,我们更像是一个以研发为龙头的企业。我们更多的是和第一线的业务去紧密结合,同时在后台去发现最实际的痛点。比如,在全量数据的状态下,很多工具都可以实现查询比对,但在实现的过程中,可能会耗时几个小时或者几天,这样的效率很难支撑我们的现实业务。在这方面,明略数据做了大量的研发和改进。针对全量数据整体的查询比对,我们能将其过程缩短为几分钟,甚至几秒。首先在效率方面,我们就取得了巨大的优势。大家也知道,数据的种类是多种多样的,非结构化的数据、结构化的数据等,很多数据的形式格式都是千差万别的。用我们通常所说的话:每个领域都有“坑”。我们现在能够提供的解决方案和产品,对全量数据的处理过程中,我们所有能碰到的“坑”基本都趟过。所以我们对全量数据加工整理的能力是相当强的。我们曾经历过这样的案例:本来可以通过某一种方式就可以锁定嫌疑人,但在过程中突然发现,用这种方式去锁定嫌疑人,我们的数据是不具备的。比如说某个摄像头或卡口,碰巧在某个时段坏了,此次行动的基石就没有了。如果调用其它类型的工具,其他的方法再来处理,很可能贻误战机。明略数据是可以对全量数据进行综合研判并加工整理,在实战过程中体现出优势。

  中国警察网:当下,各种智能终端的APP应用均不断地开放给用户,采集着用户的信息,不断触碰着用户的隐私,安全问题堪忧,明略数据又是如何在挖掘数据价值的同时,保护用户数据的安全?

  明略数据唐日新:我跟大家一样,对个人的隐私看得也很重。事实上,除了公民的个人隐私之外,还有另外一种数据安全就是国家安全。作为企业,尤其是在大数据领域当中,我们考虑的要远远超过个人隐私的层面。包括从我们产品本身设计的初衷开始,就已经贯穿这样的理念。国内所应用的很多高科技产品,开源的产品源自于国外,更多考虑的是可用性,并没有考虑到安全性。拿到国内使用的第一步,首先要考虑到它的安全性,最基本的是会不会崩溃、有没有后门、会不会很容易被人攻破。明略数据出品的产品,在封装、加工部分,我们都把它的后门,所谓的可攻击性,这些部分都已经屏蔽掉。我们写了大量的源代码,使得我们现在所应用的产品,包括基于开源的产品,都非常强大,具有军工级的防攻击性。我们现在所触碰的数据,严格意义上都是在用户方的内网。我们对能触碰到这些数据的同事进行严格的审核。公司会对每一个员工进行保密等级的培训、考试。在这个领域当中,安全无小事,最基本的安全意识是需要每一个人都拥有的。作为企业,会用这种机制去保障每一个人都没有机会触碰这些底线雷区。这不是简单的个人隐私保障的问题,已经是数据安全方面的考量。

  中国警察网:明略数据的目标是打造智慧的警察大脑,辅助每一位基层民警成为“福尔摩斯”,这个目标何时能够实现?

  明略数据唐日新:我们有相当多的民警,水平比福尔摩斯还要高。为什么这样说呢。我在上学的时候,会经常读一些侦探小说这方面的作品,包括现在也在看。文学作品中塑造出来的侦探,在判案或解谜的过程中,他的解法是非常线性的。比如说,看到一个脚印,他可以很快判断出可能是一个残疾人踩的,一个深,一个浅。他为什么有残疾呢?种种原因推测后,这个人可能经历过战争等等,会让你觉得太神奇了。但在实际的办案过程当中,这种线性的结果往往是不存在的。嫌疑人在作案,在策划的过程当中,往往随机因素、干扰因素比较多,我们很多案件的线索和证据不是第一时间你能掌握的,可能两个星期,甚至三个月以后,你才能发现这些线索。很难出现用线性的推导关系就能锁定嫌疑人,解开谜团的情况。在这种情况下,我们广大的公安民警就能够通过经验,去粗取精、浪里淘沙,把嫌疑人抓出来,是远远超过文学作品中的“福尔摩斯”。一方面我们要做的就是把这些经验,能够用机器学习的方式,用人工智能的方式把它提炼传承,让其他的兄弟单位去运用。另外一方面,我们要突破人脑的局限,例如难以长期记忆、难以穷举等,通过大数据的手段把多年积累的办案经验和我们追踪的电子痕迹结合到一起,相互学习、相互映衬。我们就能够实现,让一线的公安民警每一个人都是“福尔摩斯”,其实也是在超越“福尔摩斯”。我们已经在这个过程当中了,某种程度上,很多地方已经实现。

  中国警察网:大数据时代是充满无限生机的时代,也是一切皆有可能的时代。我们也期待着大数据等现代科技手段能够更好的服务公安工作,推动“智慧警务”转型与升级,提升公安机关的执法水平和服务水平。也感谢网友观看我们中国警察网的节目,让我们下期节目再见。

责任编辑:华锦
中国警察网官方微信:扫一扫,免费订阅!
最权威、最及时、最全面的公安新闻发布平台。
精彩的警察故事,靓丽的警花警草,靠谱的预警知识……实乃广大“警粉”微信必备!
推荐阅读
点击排行
论坛热帖
猜你喜欢