5 лучших инструментов для поиска и удаления дубликатов файлов в Linux

Управление файлами само по себе является сложной задачей. Добавьте к этому большой объем дубликатов файлов, которые обычно занимают место в хранилище, и процесс становится все более сложным.

Хотя стандартным способом борьбы с дубликатами файлов является их поиск и удаление вручную. Однако использование специальной программы для поиска дубликатов файлов может значительно ускорить этот процесс.

Так что если вы планируете избавиться от дубликатов файлов и очистить свой компьютер, вот список лучших инструментов для поиска и удаления дубликатов файлов в Linux.


1. Fslint


Fslint - это утилита с графическим интерфейсом и CLI для очистки системы от различных видов беспорядка. Она называет этот беспорядок "мусор" и предлагает множество инструментов для выполнения множества задач, включая поиск дубликатов файлов, пустых каталогов и проблемных имен файлов.

Благодаря наличию графического режима и режима командной строки, fslint облегчает начинающим пользователям Linux освобождение памяти компьютера от всевозможного системного мусора.

Чтобы получить доступ к fslint через графический интерфейс, достаточно открыть терминал и выполнить команду fslint-gui.

Что касается расширенной функциональности, то в режиме CLI программа предлагает 10 различных функций, таких как findup, findu8, findnl, findtf и finded. Используя их, вы можете уточнить результаты поиска, чтобы увеличить шансы найти определенные типы дубликатов файлов в вашей системе.

Как установить fslint

На дистрибутивах на базе Debian, таких как Ubuntu:

sudo apt install fslint

На дистрибутивах на базе RHEL, таких как CentOS и Fedora:

sudo yum install fslintsudo dnf install fslint

На Arch Linux и Manjaro:

sudo pacman -S fslint

2. Fdupes


Fdupes - одна из самых простых программ для выявления и удаления дубликатов файлов, находящихся в каталогах. Программа выпущена под лицензией MIT License на GitHub и является бесплатной с открытым исходным кодом.

Для определения дубликатов файлов в каталоге программа использует сигнатуру md5sum и проверку сравнения байт за байтом. При необходимости можно выполнять рекурсивный поиск, фильтровать результаты поиска и получать сводную информацию об обнаруженных дубликатах.

После определения дубликатов файлов в каталоге можно использовать fdupes для удаления файлов или замены их ссылками на оригинальный файл.

Установка fdupes

На дистрибутивах на базе Debian:

sudo apt install fdupes

На дистрибутивах на базе RHEL:

sudo yum install fdupessudo dnf install fdupes

Для установки на Arch Linux и Manjaro:

sudo pacman -S fdupes

Разное: Как найти и удалить дубликаты файлов в Linux с помощью fdupes


3. Rdfind


Rdfind - это еще одна утилита Linux, помогающая найти лишние файлы на вашем компьютере в разных каталогах. Она основана на сравнении файлов на основе их содержимого, а не имен, для выявления дубликатов, что делает ее работу более эффективной.

Для достижения этой цели программа работает путем ранжирования одинаковых файлов в каталоге и определения оригинальных и дубликатов: самый высокий по рейтингу выбирается как оригинальный, а остальные являются дубликатами.

Кроме того, rdfind также может вычислять контрольные суммы для сравнения файлов, когда это необходимо. И что самое приятное, он сохраняет результаты сканирования в файл results.txt в домашнем каталоге, так что вы можете обратиться к нему, когда собираетесь удалить дубликаты, чтобы убедиться, что вы не удалили не те.

Конечно, как и большинство других программ для поиска дубликатов файлов, rdfind также предлагает некоторые препроцессоры для сортировки файлов, игнорирования пустых файлов или установки симлинков. И последнее, но не менее важное: есть возможность удаления дубликатов файлов.

Разное: Что такое символическая ссылка (Symlink)? Как создать ее в Linux

Как установить rdfind

На Debian/Ubuntu:

sudo apt install rdfind

На Fedora/CentOS:

sudo dnf install rdfind

4. DupeGuru


DupeGuru - это кроссплатформенный инструмент для поиска и удаления дубликатов файлов на вашем компьютере. Одной из его лучших характеристик является возможность настроить механизм поиска в соответствии с вашими предпочтениями, чтобы увеличить шансы найти нужные дубликаты файлов в каталоге. Как и некоторые другие программы для поиска дубликатов, dupeGuru также предлагает графический интерфейс для облегчения работы.

Говоря о функциональности, dupeGuru использует алгоритм нечеткого соответствия для сканирования имен файлов или их содержимого и поиска дубликатов быстро и эффективно.

Плюс, он также хорошо справляется с музыкой и информацией, специфичной для изображений, что дает ему преимущество перед другими программами для поиска дубликатов файлов. Более того, при необходимости вы можете настроить механизм поиска именно тех дубликатов файлов, которые вы хотите удалить.

DupeGuru также позволяет удалять дубликаты файлов. Для этого в программе предусмотрена система каталогов ссылок, которая предотвращает случайное удаление не тех файлов. Кроме удаления, есть возможность переместить или скопировать их в другое место.

Установка DupeGuru

На Debian-based distros:

sudo add-apt-repository ppa:dupeguru/ppasudo apt-get updatesudo apt-get install dupeguru

На Arch Linux:

sudo pacman -S dupeguru

5. Rmlint


Rmlint - это еще одна программа для поиска и удаления дубликатов файлов в Linux. Она бесплатна в использовании и очень быстро определяет дубликаты файлов и каталогов в вашей системе. Вы также получаете поддержку формата хранения Btrfs, что выделяет его среди других инструментов в этом списке.

Кстати, некоторые другие аспекты, по которым rmlint превосходит другие конкурирующие инструменты удаления дубликатов файлов, включают возможность поиска файлов на основе определенного периода времени, поиск файлов с нарушенными идентификаторами пользователя/группы, а также поиск не удаленных двоичных файлов, занимающих много места. Кроме того, как и некоторые другие программы, rmlint сохраняет результаты сканирования в файлы rmlint.json и rmlint.sh, которые могут пригодиться во время удаления.

Необходимо отметить, что, в отличие от других инструментов, rmlint не самый простой в использовании: он генерирует скрипт для удаления дубликатов, который требует определенного уровня понимания для эффективного использования.

Как установить rmlint

На Debian:

sudo apt install rmlint

На Fedora и CentOS:

sudo yum install rmlintsudo dnf install rmlint

На Arch-based дистрибутивах, таких как Manjaro:

sudo pacman -S rmlint

Охрана дубликатов файлов в Linux


Используя перечисленные выше программы для поиска дубликатов файлов, вы можете легко определить дубликаты файлов, которые занимают место на вашей машине, и полностью удалить их. Однако при работе с такими программами следует соблюдать осторожность, чтобы не удалить важные файлы и документы в системе.

Если вы немного сомневаетесь, какие файлы следует удалить, а какие оставить, обязательно сделайте резервную копию всех данных в системе, чтобы быть в безопасности.

Ваше имя: *
Ваш e-mail: *
Код: Кликните на изображение чтобы обновить код, если он неразборчив
Введите код: