Cyrillic codepage detecting
Какой способ наиболее эффективен?
Жду ваших предложений.
Цитата:
Originally posted by Michael
Какие существуют способы определения страницы между Win CP1251, KOI8-R and DOS 866 программно читая содержимое ANSII (plain text) файла?
Какой способ наиболее эффективен?
Жду ваших предложений.
Какие существуют способы определения страницы между Win CP1251, KOI8-R and DOS 866 программно читая содержимое ANSII (plain text) файла?
Какой способ наиболее эффективен?
Жду ваших предложений.
ничего кроме проверки по небольшому словарю на ум не приходит... :)
каких-то специальных алгоритмов я не знаю :)
сам "в уме" когда вижу мусор определяю по буквам:
ЛАОЫРВТР - это КОИ8
Ёюёрэфш - это win1251 из-под 866
Е_атвRвгбв - это 866 из-под win1251
ну и т.д. видимо это и надо запрограммировать :)
значит описываем:
enum TKodings {m_Win, m_KOI, m_DOS};
В своей программке создаешь новый поток, который в фоновом режиме отправляет мыло тов. Arestov-у с текстом сообщения, кодировку которого надо определить, он на глаз прикидает кодировку и отпраляет на твой емаил, который проверяет другой твой фоновый поток. При успешном получении письма ит письма Arestov-а изымается искомое значение и приводится к TKodings. А дальше...
8-)
Ха ха ха ха ха ....!! :D я плакалъ!!! :D