Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Почтовая рассылка

Подписчиков: -1
Последний выпуск: 19.06.2015

Дублированная информация

1.3K
08 мая 2003 года
IKor
116 / / 04.12.2002
Господа!
Я не уверен, что пишу свой вопрос в нужную ветку форума, но ничего более подходящего я не нашел.

У меня есть такая задача:
Существует большьшая папка (порядка 10 Гб) с вложенными папками (глубиной до 10 папок) с большим количеством данных: в основном PDF, PPT, DOC, XLS, архивы (!), но и другие тоже есть.
Эта папка заполнялась разными людьми в разное время, поэтому информация в ней дублирована.

Необходимо найти дублированную информацию:
- по совпадению конрольной суммы (по-видимому с точностью совпанения не выше 70%);
- по совпадению имени, но с различными датами и расщирениями;
- как-нибудь еще;
- лучше найти больше совпадений, т.к. окончательное решение о перемещении файлов будет приниматься человеком;
- да, надо организовать поиск еще и в архивах.

Можете ли посоветовать что-нибудь для некоторой автоматизации процесса? Или это дохлый номер?

За ранее спасибо!
Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог