парсинг html через дом. проблема с кодировкой
Код:
$dom = new DOMDocument("1.0", "windows-1251");
$dom->loadHTML($buffer);
echo $dom->saveHTML();
$dom->loadHTML($buffer);
echo $dom->saveHTML();
как результат получаю китайскую грамоту
в переменной $buffer хранится html код в кодировке windows-1251
лазил по поиску. по всем примерам это должен быть полностью рабочий код
но увы что-то с ним не так :(
пробовал конвертить все в utf не помогло
отправлял правильные хедер с кодировкой тоже безрезультатно
решения я не нашел
но я пришел к вывод что столь не валидный хтмл код бесполезно парсить через dom
Если у тебя нет явных причин использовать DOM, то лучше заюзать регулярки. Раз в 10 быстрее работать будут.