清华郑方:声纹识别——无线互联网环境下访问控制安全的最佳解决方案

郑方:谢谢主持人,也感谢主办方邀请我。今天的主题是安全,尤其是智慧安全,刚才几位专家已经从多角度介绍了安全方面的问题。我想智慧要体现人工智能,语音是人工智能的一个主要研究方向之一,所以今天我就想在语音这个角度来看看安全有一些什么问题值得关注,有一些什么样的应用可以去从事,所以我的题目是在无线互联环境下访问控制安全的最佳解决方案,访问控制像邵先生也介绍了,安全认证方面身份认证是重要的一个方面之一。

今天我的介绍分为这么几个方面,第一是介绍现在的状况,第二是安全所面临的挑战,之后给大家介绍一下解决方案,最后介绍一下声纹识别应用的领域,最后我介绍一下得意音通的研发思考研究以及新的问题。

今天这个时代应该说有两大特点带给了大家非常显著的特色,第一是无线,你可以说在任何地方都可以有无线网,WiFi或者是4G,第二是智能终端,我们的手机随处都是,我们的穿戴式设备都很多,这两个就带来了很多新的机遇,当然也会带来新的问题。我们看看涉及在演变过程中有什么样的过程,我们最早的手机是用来通话的,后来我们发现它可以作为个人助理,再发展是作为掌上电脑,功能更全了.

现在的手机是什么呢?现在的手机已经是你的一个器官了,一个不可分割的器官,每个人不无时无刻拿着手机,丢不下、忘不掉。这是它变化的过程

我们看看手机用户的情况,可以看出手机用户现在已经达到了很大的规模,我们只看智能手机的用户,2015年第二季度已经达到了6亿,这个量是非常可观的。如果说加上各种手机都在一起的话,这已经是12已接近13亿的规模了,是非常大的一个量。

我们用这个来做什么?我觉得有三个方面,比如说上网浏览网页。第一个是入口,比如说移动设备和数据中心,往往是通过手机跟数据中心联络,跟银行联络,从而实现一些交易。第二是它也是一个个人的数据中心,你的通讯录、照片和所谓的隐私数据都在手机里,电脑里不一定有手机全。尤其是现在再加上一些云,可以把你的数据同步到云上面。所以你的手机更是这样的,这是它的一些主要的功能。

我们就是要将手机这个应用里,最典型的以这个为例子来说一下为什么访问安全很重要,也就是支付。最近手机支付是非常火的,为什么呢?

因为它很方便,我们看一下银联在15年做的移动支付安全的调查,有手机支付、网银支付、快捷支付、账户余额支付等。这都是跟移动相关的,我们看手机支付占了82%的用户的喜欢的比例。非常高,第二名不到40%。当然其实他们还有一个调查,有时候用户不敢用,为什么不敢用呢?大概有60%、70%的人觉得不安全,所以不敢用,当然看的例子也多了。

看数据来说话,用手机用户的总体的状况这里面有三个,一个是网上支付,一个是电话支付,一个是移动支付,这三个方面,移动支付具有非常快速的增长的速度。它是379.06%的增长速度,一年翻了一翻还要多。2014年相对于2013年只有134%,当然也是最高的,所以总的来说它增长的速度是非常快的。但我们说都是方便,最大的特点就是方便,这个世界上没有免费的午餐,它就会带来一些问题,我称之为方便性带来的安全问题或者说安全隐患,很多利用网络的钓鱼、移动互联网的恶意程序等等,就可以攻入到各种计算机里面,包括了移动设备里,所以这是一个非常严重的问题。

这是一个统计的报告,360的安全统计,2012年新增手机恶意软件是17万多款,同比增长是接近2000%,年增长率是用倍而不是说一个小的比例来的,所以很可观。2013年手机支付的病毒开始集中出现,这个未来的延展性是很大的,我们能知道它现在就是非常快的,所以手机支付、网购都是黑客进攻的重点,都涉及到钱,有钱就会无利不起早。

手机是否安全?手机并不安全如果大家关注3·15晚会你们会看到中间做了一些实验,你只要在一个公共场合把手机连上一个没有密码的WiFi信息就没有了,很短的时间就被窃取了,一两秒的窗口就可以获得所有人的,所以这是一个非常可怕的现象,但我们很多人其实没有这个意识,我们都图方便。

这是我大概找了一下网上讲的安全漏洞导致的案件,大家可以看有很多。这个安全问题究竟是什么问题呢?这个问题是身份认证的的问题,我称之为网络安全里面的最后一厘米,为什么叫最后一厘米呢?我们的存储安全、计算安全和防火墙等的传输都做得非常不错。但是,等到最后人和网络交互的时候,靠的是在无线互联的情况下手机和人这个地方不是一致的,所谓的人机不一致的问题就出现了。

我可以拿着你手机,我只要能拿到你的手机,所有都可以解决,密码可以召回,动态码都没有用。这个一致性的问题我称之为最后的一厘米,它很关键,而这最后一厘米其实就是远程的身份认证,它是一个关键,没有它很多问题都是不是解决的。

什么来解决这个问题?我认为生物特征识别是最好的解决方案。我们看看身份认证经历过几个发展的过程,总的来说是三个阶段,第一个是最简单的密码口令,你知道什么,天王盖地虎、宝塔震河妖,这个你知道不好解决。第二,钥匙、U盾、IC卡是通过已有的东西相对比口令要高一点安全级,可是容易丢,别人也可以把它拿走。这些都不是很好的,利用人工智能来解决问题的最佳解决方案是什么?就是你是谁用自己来证明,我的身份干吗需要别人来证明呢?上帝创造一个人就是唯一的。没有任何两个人是相同的,这是一个最好的解决途径。

当然可以看到,它的安全级别三个阶段是不断地增高可是实现的难度也是在不断增高的。有科学家对这个问题也做了预测,美国预测未来110年科技发展的基本的情况,第七条说口令和密码已经就不存在了,取代的是视网膜扫描、心跳和声音识别的技术,IBM说5年就能实现了,不用等那么久,是不是呢?大家可以想像,2012年加5年是2017年有没有实现呢?又提到了视网膜、心跳和声音这三种不同的识别方式,科学家为什么用了这三条?

什么叫生物特征,我们客观地分成两类,一类是指纹、人脸、虹膜、指静脉、掌纹包括DNA,我们称之为心理特征。它是相对来讲不变的,人的生下来基本就不变。

第二是行为特征,比如说步态、走路、签名、击键行为也不一样,这些特征大家都了解比较多,其实科学家也做了一些比较,他们通过易用性、接受程度、处理速度、成本等各个不同的领域都做了一些比较,发现他们其实有很多的地方有一些特点,各有优势。

这是2008年美国的一组科学家做的比较,可以看到这是一个DET曲线,你不需要了解太多,你只需要这个曲线靠近原点越近这个系统越好就行了,因为这代表的是错误率。这里面有人脸、指纹、手、虹膜、掌静脉、指静脉还有声音等等,指静脉是最好的。紫的那条线是声纹,次之。

科学家做了一个127页的技术报告,通过严格的理论的推导和证明,最后是给出了这个数据,可以说是颠覆了平常的一些想法,我们平时觉得最好的是指纹,当然DNA里面没有列,应该是差不多接近0点的地方。

我们看看他讲的有没有道理,其实有道理,因为有些特征存在被攻击的问题,生物特征本来是为了解决安全的问题,结果自身出现了安全问题,这就是很可怕的事。尤其用户比较害怕的是我的指纹、我的人脸被系统放在一个数据中心,别人黑客攻了之后可以用数据干任何事情,这是非常可怕的。

这里面出现了虹膜,2015年就出现了,指纹这个就更多了,当时河南考生代考事件就是用指模代考。人脸斯坦福大学的一个研究小组做的Face2Face可以模拟出来,我只要有小布什左下角的图片,上面的人模仿,机器让我摇脑袋,合成了以后右上角就摇了,你让我张嘴便模拟出来就可以长了,就可以进入这个系统,这是非常可怕的。

但我想要报告给大家的是,语音唯一一个有最多优势的特征,为什么?

今天我给大家汇报一下,语音型号是一个形简丰的语音信号,它就是一个一维信号,可是含有的信息非常多。比如说说的语言的种类,你的口音、你说的内容,说话人的性别,你的情感还有说话人的身份,当然还有在这个会场或者是在地铁或者是高铁等很多信息都在里面。

这么多信息在里面,如果把信息综合在一起就可以发现,有助于进行精准的身份认证,可以把语音结合起来,防止录音,可以把情感识别和身份识别结合起来防止被要挟。

我昨天刚看了一个新闻,人用刀逼着人输入密码,但如果用声纹可以检测你是否恐惧,是的话可以给中心一个信号,而且第二个好处是由于形简意丰可以做出语音平台,给张三转1000块钱可以识别出是业务,可以说是转1000块钱,意图可以知道我是自愿的,可以完成身份,最后所有都做完了完成银行的转账,其他任何一种特征是什么样的方式呢?

下拉菜单把转账的金额放进去,认证你的身份一系列的东西,到最后发现时间过得很长了。基于语音的特点我们提供一个解决方案,把现在的动态码技术和语音结合起来,当你需要身份认证的时候我会发一个码随机的,防止你录音,有了码之后说出来,如果都对这个就过了,如果有一个不对就不让你过了,如果把声音录起来,这是不可能的。这个获得了2013年语音创新新产品的称号,这是语音联盟的。

它有一些什么特点?第一是便宜,所有的手机都有麦克风,传输也便宜,因为只需要传音频不需要传视频。第二,录音人家不反感,如果人脸识别会觉得语音送走了,说数字什么数字都可以,我不用说家庭住址,快速、边界、安全,业绩随机性可以做到安全,当然现在可以防止录音攻击,把数字都弄下来之后切。

切完了之后拼,如果有录音的痕迹也可以检测出来,另外是做到业务相关,统一语音平台,就是一句话解决所有问题。可以看到用这样的一个方案它的优点是非常多的,有的时候单一的手段不安全,这也是一些银行客户提出来的,说也有可能有马失前蹄”的问题出现。

我们可以提供多种生物特征结合,也就是说跟人脸结合,加上唇语,我们说要把你的内容跟口型的唇语都对上去,加上语音识别的内容对上去,所以双胜利特征、双防伪来认证,这样就更好了。

我们觉得运用这个可以很好地提供身份认证的解决方案。基于这样一种思考,我们清华大学还有得意音通做了产品。核心有动态码的专利、技术、需要、快速算法,在它周围我们添加了一些功能性的,比如说录音重放的检测,自学习人的声音和人脸,然后结合场景业务相关的应用,统一的语音平台结合情感进行真实意图的检测,指纹与声纹结合,声指融合,指纹与人脸结合,我们都完成的相关的技术的开发,并在实际中得到了应用。

我给大家简单汇报声纹识别可以在哪些地方有用可以想像,有人的地方就会有应用,现在发现任何人、任何时间、任何地点,真是这样,因为移动互联网的存在和智能终端的存在,随时随地用APP打开都可以应用。

第一个应用是金融系统,跟钱相关的,,九几年就已经有了,国内也是有,我们零几年已经有了这样的系统,这是建设银行做的。原来在电话银行,自从14年4G拍照发放了以后,无线互联的普遍之后,手机银行也在增长,工行和建行都是接近两个亿的手机银行用户数。今年6月份、9月份建设银行的手机用户已经突破了2亿,达到了这么大的规模,所以应用的空间非常大。

第二,社保的生存认证,吃空饷的非常多。车联网也是一个很大的趋势,但我在网上可以控制别的地方的汽车,异地的控制,所以非常可怕。汽车的保有量有很多的应用空间,这是列了一些,实际上还有更多的应用。

最后,简单地介绍一下得意音通,我们是清华入股的公司,也和清华大学建立了联合实验室,我们在进行产学研结合的时候构建了立体的架构,这是合作产学研的架构,既有入股也有联合实验室,产品经过长时间大规模的应用,建行在手机银行用这样一个手机系统的时候花了一年半的时间做应用,最后发现是可行的。

我给大家报告一个数据,非常让我感到鼓舞的,我作为生存识别和语音识别方面接近30年的时间,觉得没有白做,我们大概用了一个月的时间,一个月的增长相当于一年的增长。建行已经放开了使用,大家可以体验一下。

我们和银联做了生物特征的实验平台,也有很多合作的银行,我们国家信息中心这个解决就是电子政务里进行远程的签审。和中国移动做的移动指纹、声纹的平台,公安领域也做了很多,有很多的专利,但在标准方面我们做了很多的工作。

中国的第一个标准是由我们来负责起草的,在2008年发布,公安部的标准我们参与了很多。金融领域的标准正在制定,为什么美国科学家做预测的时候提到了三种特征,第一是讲到了声纹的优势和特点,所以在央行制定标准的时候,唯一的生物特征的标准是声纹。

当然现在国家正在考虑做一些声纹库的建设工作,这是14项声纹相关的标准,尤其是中间要建库,以后每个人从有身份证的时候就要留起来。当然信标委和智能设备的标准都在做。从研究应用标准化等各个方面都打开了局面,所以我认为生物特征识别应用的时代已经到来。

谢谢各位!

上一篇:东软杜强:人工智能——网络安全产业发展新机遇

下一篇:中科院黄凯奇:智能时代的视频监控发展