Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Почтовая рассылка

Подписчиков: -1
Последний выпуск: 19.06.2015

Поиск файлов-дубликатов на диске

20K
06 сентября 2009 года
dmitry_12_08_1973
22 / / 17.01.2008
Подскажите, как найти файлы на диске, которые имеют одно и тоже имя, размер и время создания.
5
06 сентября 2009 года
hardcase
4.5K / / 09.08.2005
Цитата: dmitry_12_08_1973
Подскажите, как найти файлы на диске, которые имеют одно и тоже имя, размер и время создания.


Вот простой сценарий: нужно построить таблицу-индекс по всем файлам, индексом в данном случае будет хэш-сумма (md5 или sha1). Все содержимое файла хэшировать не нужно - это слишком долго, но можно захэшировать лишь первые несколько килобайтов файлов (например 64). Далее искать все коллизии. При обнаружении коллизии произвести более детальное сравнение - сравнить размер (если отличается наверняка файлы различны), дату и содержимое.

14
07 сентября 2009 года
Phodopus
3.3K / / 19.06.2008
+1
или воспользоваться одной из программ типа DupDetector, DuplicateFinder,...
Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог