Как читать форматы doc и docx?
Я парень молодой, неопытный. Может и вопрос мой ламерский.Но...
Хочу написать мааааааленькую програмку которая могла бы быстро открывать документы doc и docx, а то на моей ЭВМ, 2007 ворд ОЧЕНЬ долго открываеться. Но вот каким образом там "шифруються" данные понять не могу. Может на это дело есть какая библиотека? Думал разобратся сам, но когда открыл документ в блокноте понял что не все так просто, а ведь там еще есть всякие непечатаемые символы, про документы с таблицами и вставками я вообще молчу. Так может кто уже имел с этой байдой дело? Поделитесь, пожалуйста, наблюдениями.
Формат *.doc - закрытый, а docx - это zip-архив с кучей *.xml файлов - при желании можна разобраться. В .NET существует механизм работы с офисными документами, и найти документацию по нему достаточно просто - нужно всего-лишь 5 минут погуглить!!
Doc - уже открыли. Недавно на ЛОРе обсуждалось.