regexp vs DOM
з.ы. объёмы получаемого документа могут быть очень большими (до 1Мб чистого текста)
Двусмысленно... Надо законспектировать и научится подобным образом водить за нос жену, начальство и прочих... :D :D :D
Ну это смотря что и в каком объеме требуется искать. Без всяких опыто думаю ясно, что в одних задачах DOM будет и более удобнее и быстрее, в других регулярка будет быстрее.
Приведу пример. Мне для одной задачи нужно найти некое слово на странице. Причем это слово может быть какое угодно количество раз. При этом я не знаю в какой части страницы располагается это слово. Вот тут DOM очень полезен и регулярками тут врятли что решишь.
Помоему, тут как раз таки лучше регулярными оперировать. Ибо, в DOM'е всё равно будешь шарить по узлам и искать строку с помощью strpos или preg_math.
Спецом для mfender-а (:D гы гы) разворачиваю ответ.
DOM позволяет абстрагироваться от структуры входных данных. Мы работаем с абстрактной моделью которую к тому же можно еще и сохранять в другие файлы или модифицировать.
А регулярки нередко привязывают нас к определенной структуре данных ибо в регулярке нередко содержиться описание структуры входищих данных. Изменилась структура входных данных (поправили так HTML код страницы) и регулярка может и перестать работать.
Хочу поддчеркнуть, что я не за DOM или регулярки. Я за использование того инструмента, который для текущей задачи оптимален.
Да. Собственно пример возник из практического опыта написания вот этого сервиса http://alekciy.ru/test/ (так и неделанного, благо сейчас в отпуске и видимо таки допишу).
XPath на что? И потом использование DOM не исключает использование регулярок.
И, кстати, для этих нужд нужно всего 2 regexp. ну максимум три. И все дефекты кода можно учесть.
:D мы в привате пришли к такому же выводу. Но я не холиварю. Не пять лет все же ))) Ну поболтали немного... почему бы и нет? :)
PS: а что лучше... таки не скажу - потому что +1 к холивару )))))))))