проблема с кодировками в XML
DocumentBuilderFactory df = DocumentBuilderFactory.newInstance();
df.setNamespaceAware(true);
DocumentBuilder bulder = df.newDocumentBuilder();
doc = bulder.newDocument();
... дальше к этому документу я добавляю детей ну и так далее... для данного документа устанавливаеться автоматическая кодировка UTF-16...
... после вызываю парсер что бы получить текст xmlкод Java
DOMSerializerImpl ser = new DOMSerializerImpl();
String s = ser.writeToString(doc);
... дальше... получив этот документ... мне нужно его в другом месте разпарсить... я создаю ByteArrayInputStream передаю байты от s... это поток передаю парсеру... код Java
DocumentBuilderFactory df = DocumentBuilderFactory.newInstance();
df.setNamespaceAware(true);
DocumentBuilder builder;
Document doc;
builder = df.newDocumentBuilder();
doc = builder.parse(is);
... на последней строке выпадает исключение...код Java
Fatal Error] :1:40: Content is not allowed in prolog.
org.xml.sax.SAXParseException: Content is not allowed in prolog.
... был проведен эксперемент в результате которого установленно... что проблема в том что кодировка у созданного документа UTF-16...
... подскажите как устанавливать эти кодировки... или что я не правильно делаю...
Не уверен, но получал такую же ошибку при парсинге SAX парсером utf файла - создавал такую тему недавно. Дело было в том, что в этом файле в начале файла ставился BOM символ - в юникодах всегда так - его видно в hex редакторах - так вот sax парсер по крайней мере его не понимает. Если этот символ убрать - то вроде должно работать.