你就是个loser
首页
生肖配对
生日密码
血型配对
生日花语
生肖血型

生日密码

当前位置:北京赛车官网 > 生日密码 >

一次忘记密码引发的算法思考

编辑:卢本伟2019/02/08 11:58

  前段时间,华住(某大型连锁酒店)再次发生脱库事件。由于内部程序员失误,将数据库密码公开于Github上,让人拿走了数亿用户的开户记录和他们的登陆信息(包括密码)。假如这些密码用存储,那盗取数据库后,拿到密码,就可以轻而易举的拿邮箱和密码去尝试登陆你的各种社交网站,甚至各种金融帐户。要知道有很多人其实对账户安全不够重视,金融账户和社交账号都使用同一个密码。在如此数量级下(上亿)的帐户密码泄露,对于互联网安全将是一场巨大的。

  彩虹表的存储空间是字典法的 k 分之一,代价是运算次数至少是原来的 k 倍。

  彩虹表确实像它的名字一样美好,至少黑客眼里是这样。下表是7位以内密码在不同字符集下构造出的彩虹表的情况,彩虹表中哈希链的长度和个数随着字符集的增长而增长,彩虹表的大小和生成时间也随之成倍增加。7位数字组合在彩虹表面前简直就是秒破,即使最复杂的7位密码不到一个小时就能破解,如果采用普通的,破解时间可能需要三周。

  接下来为大家介绍一种高效的密码方法:彩虹表。它可以用于复杂一点的密码。

  哈希(Hash)算法,由于其不可反向破解的特性被广泛用于私密信息的和校验。

  这里有一点细节,值得我们注意,为什么我忘记了密码,你不直接把原密码返回给我?而是给我一个不相关的口令来重置密码?

  如果两个不同的用户,得到了同样的 token,就发生了哈希碰撞。服务器将把这两个用户视为同一个人,这意味着,用户 B 可以读取和更改用户 A 的信息,这无疑带来了很大的安全隐患。

  很多网络服务会使用哈希函数,产生一个 token 用于标识用户的身份和权限。

  那么问题来了,在数据库存储的到底是什么?它应该是被某种算法加密过的密文,并且无法进行反向破解,了被黑客拿到了也能数据的相对安全。而这个算法,就是我们接下来要介绍对哈希算法。

  反思枚举法,它其实做了太多无用的计算。一般人的密码都会取一些有特殊意义的字符,比如生日,名字缩写等。有人就会把这些常用的高频率的密码组合,试先计算并存储起来。等到要用的时候,直接到数据库里查询对应的哈希值就行了。

  有不少人会将哈希(Hash)和加密(Encrypt)混淆起来,其实它们是不一样的:

  哈希算法是一个比较泛的概念,他的具体实现有许多种,大家所熟知的有 MD5,SHA256等。

  彩虹表实质上还是属于字典破解的一种,不过不再是简单的—密码的对应,为了节省字典存储空间,彩虹表省去了能通过计算得出的数据,达到这点的关键在于设计出一个函数族Rk(k=1、2、3、4……)将hash密文空间映射回的字符空间。

  现在拿 MD5来举例,MD5消息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value)。

  就算有一天,真找到一个和目标哈希值相等的原文,这个原文也不一定是答案,因为哈希冲突的存在,多个原文是有可能有着同一个哈希值。

  但是人类实在二进制,所以128位的二进制通常会表示成32位的十六进制(由0-9,a-f组成),他们是等价的。

  假如在网络传输过程中不幸被黑客修改了目标帐户和转帐金额,等到了支付平台的服务器端,会将传输过来的信息和之前约定好的字符串再次进行哈希。然后和之前那个哈希进行比对,由于之前的数据已经被了,所以验证不通过,转帐失败。从而了我们的资金安全。

  如果使用哈希算法,就可以在客户端处,将转账的信息进行处理,处理方法是,将要加密的数据加上一个约定好的字符串一起进行哈希,生成一个信息摘要。

  前两天准备登陆某网站的时候,在尝试了几次常用密码失败后,我点击了“忘记密码”,娴熟地填入手机号码,随即就收到了一条来自陌生号码的短信,里面包含着一个六个数字串,我将这个数字串填入网站提供的输入框,就进入了密码重置流程。

  前面讲到了许多哈希在实际生活中的应用,可以发现,哈希被广泛的应用在安全领域。那哈希真的没有办法破解吗?

  需要海量的磁盘空间来储存数据,仍以14位字母和数字的组合密码为例,生成的密码32位哈希串的对照表将占用2.64 * 10^14 TB 的存储空间。如何增加密码长度或添加符号,需要的时间或磁盘空间将更加难以想象,显然这两种方法是难以让人满意的。

  穷举法,就是简单的枚举出所有的原文,并计算其哈希值,然后将计算结果与目标哈希值一一比对。由于原文的可能性有无数多种,所以这种方法时间复杂度高得离奇,极不可取。需要大量的计算,因此破解速度非常慢,以14位字母和数字的组合密码为例,共有1.24×10^25种可能,即使电脑每秒钟能进行10亿次运算,也需要4亿年才能破解。

  这篇文章,写得比较通俗易懂,其中借鉴了网上一些不错的文章,算是一篇科普文,想要深入了解,你还需要自己做更多的研究与思考。如果有写得不对的地方欢迎大家微信我!

  由于哈希算法是一对多的映射,所以不同的输入是有可能得到了同一个哈希值,这时候就发生了哈希碰撞(collision)。

  

生日密码

  如此看来,服务器是不会存储你的用户密码的。这也就能解释,为什么不干脆直接将原密码返回给你了。因为就连他们也不知道。

  我们都用过网络支付工具,假如我现在从 A 帐户转给帐户 B 1000块钱,交易信息在网络中进行传输,有可能被黑客给截持并我们的数据,将目标帐户改成黑客自己的帐户。如此一来,我们的就被窃取了。