讨论: 清除重复文件的好办法

从现在起,增加一类文章,并相应增加一些软件。具体说来就是,以前基本不介绍我用不到的软件门类。但毕竟我用不到不代表大家都不用,所以,大家把经验汇总一下,也可以形成有价值的文章。当我想到这样的题目时,或有读者问到这样的题目时,我就会发一篇“讨论:xxxxx”的文章,请大家发表意见和建议。过一段时间,整理成“总结:xxxxx”。今天的主题是“清除重复文件”,由JackyLan网友提出。

xbeta先抛砖引玉:

我的认识:什么是重复文件?有不同程度的定义。先看“名”:文件名是否要相同?再看“实”:是二进制比特流相同,还是要“内容”相同?最严格的,当然是一个文件复制到另一个目录,则名称、内容完全相同。但某些情况下,尤其是对于有损压缩或变比压缩,虽然二进制比特流不同,但我们认为它们是同一个文件。比如2个jpg,文件大小不同,但是同一幅图片;2个mp3,精度稍有不同,但为同一首歌;2个zip,压缩比不同,但其内部都是同样的文件……基于不同的假设,才有不同的解决方案。最严格的比较,要看文件名、大小、以及校验码。按内容比较,则实际上要考虑解码过程,因此,多会出现一些专门工具,比如发现图片查重、音乐查重、视频查重。

我的做法:上文纯属纸上谈兵(不过理论认识还是很重要的),因为xbeta管理文件比较有条理,再加没有收集资料/音乐/图片/的习惯,所以实际没遇到重复文件的问题,也就没使用任何此类软件。如果偶有需求,我大概会试用TC解决(参见:http://xbeta.info/studytc/tc004.htm 中搜索“查重”)。

一些资料:

CloneSpy [匿名] SunSpring 2007-04-24 11:19:15  推荐一款重复文件查找工具,个人用过觉得最好的,且是免费的.不过是英文,没有汉化的版本,我想有点英文基础的都能用的来. 软件名称 CloneSpy 2.3 软件大小 565 KB 运行环境 Win2003, WinXp, Win2000, Nt, WinMe, Win9x 授权方式 免费版软件语言 英文软件简介 CloneSpy 能够扫描出电脑中文件名相同、一模一样、0字节的文件,不仅能够避免电脑中文件重复浪费空间,还可以用来作硬盘/光盘的文件比对。出自这里

Duplicate File Finder这里介绍过。

小众介绍过DoubleKiller – 专业重复文件清理Duplicate Music Files Finder – 硬盘重复音乐查找WICleanup – Windows Installer 冗余文件清理工具

当然,还有JackyLan网友刚刚发现并认定很好的 Duplicate Cleaner 1.2

是不是还有好软件没有介绍?或你对这些软件有心得?敬请留言,分享大众。>

《讨论: 清除重复文件的好办法》有18个想法

  1. easy duplicate finder,免费软件,语言,英文,对我个人来说界面相当不错,很得我的好感,我不怎么用,不过感觉还不错。

  2. acdsee带的查找重复 它的好处是可以比较两个文件夹的文件 删除的时候自动选中其中一个文件夹内的文件 删除起来很方便

  3. XnView的搜索相似文件功能就很不错了,可以按文件名、二进制、类似的图片内容来搜索。而且它不光针对图片,可以搜索所有类型的文件,所以应用范围很广。

  4. 感谢Xbeta,速度真快啊,呵呵。
    以前没用过相关软件,因为受Xbeta影响特别喜欢用TC,所以不想再下载软件而是希望能通过TC解决,问过Xbeta得知没有好的方案所以误打误撞找到这款软件。我从download.com以duplicate为关键字搜索,在搜索结果的软件列表中看了一下星级,Duplicate Cleaner 1.2评价高就下载了一试,感觉相当不错,当然它也是FreeWare。

    简单介绍一下Duplicate Cleaner的功能(当然我还没用过其他相关软件,大家有好的也可以一起分享):
    1.可以设置添加多个路径,可以筛选文件类型
    2.重复的定义包括:内容相同(CRC校验),文件名相同,大小相同,日期相同
    3.可以设置文件大小范围
    4.特别针对音乐文件,可以选择专辑,歌名,歌手来区分是否同一首歌曲
    5.查找结果有三个列表,分别是重复文件(按组用颜色区分),所有文件,零字节文件
    6.搜索结果选择功能相当丰富:
    a)可以根据日期,大小,或者保留一份,全选
    b)支持文件名称和路径的通配符(好像还不支持正则)
    c)特别针对音乐文件的选择方式:保留高比特率,保留长度最长,保留最高sample rate(不明白什么意思)
    7.对已经选择的文件可以作删除和移动操作
    8.可以导出为csv文件列表,当然也可以导入csv文件列表进行操作

    btw:Duplicate Cleaner是英国一家叫作Digital Volcano的软件工作室的作品,官方网址如下http://www.digitalvolcano.co.uk/,目前最新版1.2,官方预告1.3即将发布。

    1. 补充:对重复文件的处理,除了删除和移动外,还有一种叫做创建“硬连接(Hardlinks)”,相当于是保留重复文件的其中一份,然后在其他位置创建“快捷方式”指向这个文件,这样的好处显然是为了节省空间(用WINDOWS的文件管理器好像看不出来节省了空间)。与快捷方式不同的是,这个硬连接可能是基于硬件层面的。这样,当你修改其中一个文件,其他文件也同时会改变(实质上只有一个文件)。这个功能只有Win2K以上系统且在NTFS分区可用。

      官方关于Hardlinks的说明:
      Create Hard Links
      (What is a Hard Link? From Microsoft.com) A hard link is a directory entry for a file. Every file can be considered to have at least one hard link. On NTFS volumes, each file can have multiple hard links, and thus a single file can appear in many directories (or even in the same directory with different names). Because all of the links reference the same file, programs can open any of the links and modify the file. A file is deleted from the file system only after all links to it have been deleted. After you create a hard link, programs can use it like any other file name.

      You can only create hard links on NTFS volumes using Windows XP, 2000, or Vista. You cannot create hard links between volumes (different hard drives or network shares). Duplicate Cleaner will only let you hard link CRC-matched (same content) files.

      When creating Hard Links there needs to be at least one file in each duplicate group left unticked. This will be the ‘original’ file to which the other ticked files in the group are linked. Once linked there will appear to be no difference between the linked file and the original in Windows Explorer. In addition, hard linked files will appear again as duplicates if you re-scan. (Something to be addressed in future versions of Duplicate Cleaner).

  5. 搭车问个问题……..

    我这出现了一个文件夹 里面一层一层的空文件夹 大约有100来层 不让删除….
    在TC里也不让删…类似被使用的对话框 用unlock删除也只是刷新一下 没有别的反应
    在CMD里用命令删 也报错……..

    怎么才能删掉他??????

  6. 我也推荐一个:
    DoublesFinder V1.1c:免费的重复文件查找工具

    DoublesFinder 是一款免费软件,用来查找电脑中的重复文件,可自定义查找的文件大小范围,如有重复文件,则可直接删除。DoublesFinder对重复文件的定义是:两个文件具有相同的内容,即使有不同的文件名。

    DoublesFinder只有一个主程序,无需安装直接运行,只在需要保存语言和皮肤时才操作注册表。DoublesFinder虽然是英文界面,但是简单易用!

    详细:http://www.portablesoft.cn/read.php/42.htm

  7. 简单的对比后,目前发信clonespy没有double killer好。
    我仅在一个目录下搜索,clone spy只发现两个重复,而double killer则进行了更多的对比,发现了更多的重复。
    而且double killer的free版仅仅一个文件,很绿色的说。

发表评论

电子邮件地址不会被公开。 必填项已用*标注