Поиск по изображениям
На входе:
- Несколько ТБ графических файлов которые можно заранее проиндексировать.
- Картинка, примерная копия которой ищется среди заранее проиндексированных.
Нужен неточный поиск. Картинка может быть уменьшена, кропнута и немного отредактирована (уровни, яркость, контрастность, убран мусор).
В идеале, набор консольных программ под Linux.
Наверняка велосипед уже изобретен. Может кто встречал?
Если хотя-бы был размер один-в-один можно применить маску и сравнивать по маске.И это не факт. Or я не понел Ваш вопрос.
XnView не совсем то. То - tineye. Вот нужно тоже самое, только локальное.
Делал на Perl+ImageMagick. Все картинки индексируются заранее. Потом с этим индексом сравнивается новая картинка.
Пример работы скрипта при поиске подобных изображений.
С исходныого файла были сделаны копии уменьшеные, обрезанные, убрана подпись, зеркально повёрнут, увеличен контраст.
Сравнение по похожести 600 однотипных изображений здесь: http://illari.ru/files/gold/
Skype:illariRU
Email:illari.sochi@gmail.com
Libpuzzle - сохраняет хэши для быстрого поиска, но уступает в качестве сравнения
Если оно работает, то должно подойти. Спасибо.
Скажем так, пока фотографий до 500, ищет вполне сносно. Но когда речь заходит о 100 тыс., результат поиска становится больше похож на случайную выборку.
Ладно-ладно наштопали минусов объясните, почему ?
Сравнивать картинки на предмет один-в один - это есть понятно. Но если картина изменилась в размерах or текстуре ,что тогда ?
Ну если, типа такого устраевает автора темы[РЕШЕНО]. Скажу словами В.Цой
Здесь не понятно, где лицо, а где рыло, и не понятно , где пряник и где плеть.
FOR mike
Кто ставит минусы и плюсы, публично показать КТО ПОСТАВИЛ , а п........ь из угла каждый может.
For mike - это стопрЪ . Он как всегда отмолчится, админ типа не в теме.
ЖДУ ответа!!!
Потому что изъясняться надо так, чтобы тебя понимали. Из твоего первого сообщения ничего не понятно.
Из второго понятнее, но пришлось пару раз перечитать. Кармаспин пока останется анонимной.
Внезапно начинает пробивать на коллизии по хэшам?
Нет, с этим как раз все в порядке. Дистанцию странно считает, как будто генератором случайных чисел.
На слове "дистанция" стал гуглить, неужели нет ничего подобного в виде плагинов к MySQL или PostgreSQL. Нагуглил.
На прошлой работе активно пространственные (spatial) индексы использовали для работы с географией. Под Oracle, правда, но не суть. Всякие нестандартные индексы, работающие внутри движка реляционной СУБД, очень удобны.