Просвятите по кодировкам.
А сейчас встала необходимость использования windows-1251. Меня интересует, на сколько хорошо её распознают англоязычные браузеры? И ещё, будет ли дополнительно нагружаться сервер, если настроить Апач на выдачу страниц в определенной кодировке, отличной от реальной кодировки страницы? Какие ресурсы используются при перекодировании, выделенные для моего хоста или серверные?
Возможно, я не коректно задаю вопросы, но уж не ругайте, для меня, что Апач, что Шатл...:D
Помогла прога Access2MySQL PRO, она позволяет делать перекодировку при закачке в базу.
[censored]
http://ru.wikipedia.org/wiki/UTF-8
http://ru.wikipedia.org/wiki/Юникод
На сегодняшний день - наиболее удобное решение.
http://ru.wikipedia.org/wiki/Юникод
На сегодняшний день - наиболее удобное решение.
Цитата:
На сегодняшний день - наиболее удобное решение.
Наверное, так и есть, но не очень мне подходит, размер базы становится минимум в пять раз больше.
Цитата: Ghirik
Наверное, так и есть, но не очень мне подходит, размер базы становится минимум в пять раз больше.
Это ж интересно, откуда там 5 раз?! Я, конечно, не знаю формата вашей базы, но, дело в том, что размер чисто англоязычного текста в UTF8 будет таким же точно, как и в другой "односимвольной" кодировке. Размер же русского текста, например, должен быть максимум в 2 раза больше. Существуют, конечно, и 4-байтовые символы в юникоде, но они по-моему не используются.
Не в 2, а ~ на 30%.
Цитата: Ghirik
Наверное, так и есть, но не очень мне подходит, размер базы становится минимум в пять раз больше.
"Известие о моей кончине сильно преувеличены" (с) ;)
Дело было так. :)
Я занимался машинным переводом английских баз. Делал это следующим образом. Загружал базу из Мускула в Access, из Access-а экспортировал нужное место в html, далее чистил фай поиском заменой от всякой ненужной дряни типа стилей и атрибутов, потом переводил. Потом снова чистил, потом импортил в Access на прежнее место.
После всех этих процедур, Access размер базы становился 90Мб, при начальных 17Мб. При этом html файл, после перевода увеличивался всего процентов на 25-30. В Access-е по умолчанию стоит uif-8, и изменить это я не смог.
Но как видите нашлось решение, база после перекодирования становится снова нормальной.
Был поражен результатом! Дамп базы в кодировке 1251 весил 35Мб, после перекодирования, стал весить всего 38Мб.
Всем большое спасибо...
На всякий случай, вдуг кто заглянет нуждающийся в перекодировке. Я использовал такой запрос:
[HTML]
alter table prefics_name convert to character set utf8 collate utf8_general_ci;
[/HTML]
Цитата: Ghirik
Был поражен результатом! Дамп базы в кодировке 1251 весил 35Мб, после перекодирования, стал весить всего 38Мб.
Всем большое спасибо...
О чем тебе и толкуют. Лично я уже давно перешел полностью на UTF-8. Даже несмотря на то, что ни какая мне интернационализация не нужна. Главное от кракозябров огражден :D