pdf 2 html
в полученном html коде font-family:Times New Roman; + дописываю в head [meta http-equiv="Content-Type" content="text/html; charset=windows-1251"]. это не помогает.
по идее, в ms word есть сервис "исправить поврежденный текст", который его должен исправить... ещё не смотрел.
всего таких страничек - около 300. какой-нибудь есть выход в сложившейся ситуации, либо нужно писать макрос для word'a, который все это дело будет править?..
извиняюсь за возможный оффтоп, просто не знаю, где ещё задать этот вопрос.
Цитата:
Originally posted by anote
экспортирую из pdf в html с помощью pdf2html, на выходе получаю файлы, причем шрифты все слетели. по всей видимости, внутрь pdf файла зашит набор шрифтов, которых у меня нет.
в полученном html коде font-family:Times New Roman; + дописываю в head [meta http-equiv="Content-Type" content="text/html; charset=windows-1251"]. это не помогает.
по идее, в ms word есть сервис "исправить поврежденный текст", который его должен исправить... ещё не смотрел.
всего таких страничек - около 300. какой-нибудь есть выход в сложившейся ситуации, либо нужно писать макрос для word'a, который все это дело будет править?..
извиняюсь за возможный оффтоп, просто не знаю, где ещё задать этот вопрос.
экспортирую из pdf в html с помощью pdf2html, на выходе получаю файлы, причем шрифты все слетели. по всей видимости, внутрь pdf файла зашит набор шрифтов, которых у меня нет.
в полученном html коде font-family:Times New Roman; + дописываю в head [meta http-equiv="Content-Type" content="text/html; charset=windows-1251"]. это не помогает.
по идее, в ms word есть сервис "исправить поврежденный текст", который его должен исправить... ещё не смотрел.
всего таких страничек - около 300. какой-нибудь есть выход в сложившейся ситуации, либо нужно писать макрос для word'a, который все это дело будет править?..
извиняюсь за возможный оффтоп, просто не знаю, где ещё задать этот вопрос.
Зачитала два раза - чего - то никак не могу понять в чем вопрос... а может просто найти нужные шрифты... тем более что их можно выдернуть из пдф-доки