поисковый механизм...[web-программирование]
Можно такое сделать?! Если да, то буду рад версиям..желательно код..
Заранее благодарен..
Цитата:
Originally posted by rhz
Есть внешний файл с данными. Имеется веб-страница с формой поиска. Пользователь вводит запрос, скрипт должен просканировать внешний файл и если есть совпадение, то взять в том же файле ссылку и вставить ее в браузер либо просто сгенерировать страницу с указанием этой ссылки.
Можно такое сделать?! Если да, то буду рад версиям..желательно код..
Заранее благодарен..
Есть внешний файл с данными. Имеется веб-страница с формой поиска. Пользователь вводит запрос, скрипт должен просканировать внешний файл и если есть совпадение, то взять в том же файле ссылку и вставить ее в браузер либо просто сгенерировать страницу с указанием этой ссылки.
Можно такое сделать?! Если да, то буду рад версиям..желательно код..
Заранее благодарен..
мысли такие:
- открываешь удаленную ссылку(fopen, fread)
- ищешь в нем совпадения(строковыми функциями или регуляркой)
- если есть совпадения выводишь эту ссылку.
в реале этот скрипт будет работать супер- медленно(догадываешся почему ;)), чтобы улучшить ситуацию, необходимо заранее проиндексировать
все эти сайты(т.е. разложить по полочкам и занести в БД). кажется все ....
Какого рамера файл, в какой формате там данные ?
Построение индекса сильно ускоряет поиск, но сильно замедляет добавление/обновление.
Ксли размер файла менее 200Kb, то можно спокойно обойтись без индексации
Кроме того сущесвуют алгоритмы быстрого поиска.
А почему нельзя загрузить предварительно внешний файл, для более быстрой обработки. И вообще что за данные?
Если у нас есть совпадение, то мы просто эту ссылку будем вставлять на вновь сгенерированную страницу..
По идее должно вот так быть.
Файл большой ? Он m3u ? Сколько строк?
Файл может быть с разными расширениями (например, TXT, SFV, RTF, csv, html)..что касаемо строк, то в начале не очень много. Со временем может будет побольше.
Цитата:
Originally posted by rhz
Файл может быть с разными расширениями (например, TXT, SFV, RTF, csv, html)..что касаемо строк, то в начале не очень много. Со временем может будет побольше.
Файл может быть с разными расширениями (например, TXT, SFV, RTF, csv, html)..что касаемо строк, то в начале не очень много. Со временем может будет побольше.
То есть структура сайта заранее не известна ?
Тогда однозначно строить индекс.