1、压缩性:任意长度的数据,算出的MD5值长度都是固定的。 2、容易计算:从原数据计算出MD5值很容易。 3、抗修改性:对原数据进行任何改动,哪怕只修改1个字节,所得到的MD5值都有很大区别。 4、强抗碰撞:已知原数据和其MD5值,想找到一个具有相同MD5值的数据(即伪造数据)是非常困难的。 MD5原理 1.1 数据补齐 ...
人工去重的工作量太大,于是写了一个小工具用于去重。原理很简单,计算各个文件的MD5值,若值相同,则认为是同一文件。为了避免误删,会新建一个文件夹,将重复的文件移至该文件夹(而不是直接删除重复的文件),需要用户手动删除。后来还增加了“按照文件类型自动归档”和“批量重命名”的功能。