当前位置: 首页 > news >正文

在 Ubuntu 上查看重复文件

一般情况下

1. 使用 fdupes 工具

fdupes 是一个专门用于查找重复文件的工具。

安装:

sudo apt-get install fdupes

使用:

fdupes -r /path/to/directory

-r 选项会递归查找子目录中的重复文件。

2. 使用 rmlint 工具

rmlint 是另一个强大的重复文件查找工具,并且可以生成删除脚本来帮助清理重复文件。

安装:

sudo apt-get install rmlint

使用:

rmlint /path/to/directory

默认情况下,rmlint 会输出报告,但你可以使用 -o 选项来生成删除脚本。

3. 使用 findmd5sum 命令组合

如果你喜欢使用命令行,你可以通过结合 findmd5sum 命令来查找重复文件。

示例:

find /path/to/directory -type f -exec md5sum {} + | sort | uniq -d --check-chars=32

这个命令会计算所有文件的 MD5 校验和,并找出重复的校验和。

4. 使用图形界面的工具

如果你更喜欢图形用户界面,可以使用工具如 BleachBitdupeGuru 来查找重复文件。

安装 dupeGuru:

sudo add-apt-repository ppa:dupeguru/ppa sudo apt-get update sudo apt-get install dupeguru

启动 dupeGuru: 在应用菜单中找到 dupeGuru 并启动它,按照向导选择目录来扫描重复文件。

多线程处理

如果你希望使用多线程来加速查找重复文件的过程,可以考虑以下工具和命令:

1. rmlint

rmlint 支持多线程。它会自动检测并使用系统的 CPU 核心来加速文件扫描过程。

示例:

rmlint -c sh /path/to/directory

这里的 -c sh 选项会生成一个 shell 脚本以清理重复文件。rmlint 默认会使用多线程来提高性能。

2. fdupes

fdupes 本身不直接支持多线程,但可以通过其他工具来加速。例如,可以将目录分割成多个部分,然后并行运行多个 fdupes 实例:

find /path/to/directory -type d | xargs -I{} -P 4 fdupes -r {}

这里,-P 4 选项指定使用 4 个并行进程来运行 fdupes

3. findmd5sum

你可以使用 GNU Parallel 来并行处理 findmd5sum,从而利用多线程来加速查找:

安装 GNU Parallel:

sudo apt-get install parallel

示例:

find /path/to/directory -type f | parallel -j 4 md5sum {} | sort | uniq -d --check-chars=32

这里的 -j 4 选项表示使用 4 个并行线程。

http://www.lryc.cn/news/433447.html

相关文章:

  • docker容器高效连接 Redis 的方式
  • 手撕Python之生成器、装饰器、异常
  • LabVIEW步进电机控制方式
  • vllm源码解析(五):LLM模型推理
  • 数学建模笔记——熵权法(客观赋权法)
  • XGBoost算法-确定树的结构
  • concurrentHashMap线程安全实现的原理
  • 域名证书,泛域名证书,sni
  • Pytest夹具autouse参数使用。True表示会自动在测试中使用,而无需显式指定
  • Linux:归档及压缩
  • jenkins 安装
  • mysql学习教程,从入门到精通,MySQL 删除数据库教程(6)
  • C语言:刷题日志(2)
  • 微带结环行器仿真分析+HFSS工程文件
  • 怎么仿同款小程序的开发制作方法介绍
  • 音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现
  • 0.91寸OLED屏幕大小的音频频谱,炫酷
  • 6. LinkedList与链表
  • Statcounter Global Stats 提供全球统计数据信息
  • Linux kernel中的dts dtsi dtb dtc dtb.img dtbo.img
  • 微信小程序页面制作——个人信息
  • 使用C++11的`std::async`执行异步任务:实战指南
  • 【高阶数据结构】B树、B+树、B*树
  • HBuilderx中vue页面引用scss样式
  • 粒子群算法原理的示例介绍
  • GNU/Linux - Open函数使用的O_CLOEXEC flag
  • AWQ量化(Activation-aware Weight Quantization)
  • SprinBoot+Vue体育商品推荐的设计与实现
  • 【Python基础】Python函数
  • 【超简单】1分钟解决ppt全文字体一键设置