Все для программиста!

Ваш аккаунт

Войти через:

Забыли пароль?
Регистрация

Информацию о новых материалах можно получать и без регистрации:

ВКонтакте

Последние темы форума

Музыка — 2019-04-26 23:59:43 (1)
Общалка :) / Кристина Ивлеева
Как внести числа в сгенерированный массив чисел СЛУЧМЕЖДУ — 2019-04-25 11:15:30 (0)
Visual Basic / wanx
рабочее зеркало гидры — 2019-04-22 13:27:49 (1)
Операционные системы / Tony_Montana
гидра анонимный — 2019-04-21 15:37:08 (0)
Низкоуровневое программирование / Tony_Montana
гидра браузер — 2019-04-21 11:49:42 (0)
Компьютерная безопасность / Tony_Montana
Закрытие главной формы из другой. — 2019-04-19 09:08:27 (1)
Borland C++ Builder / Lazy_Man
гидра оф сайт — 2019-04-18 13:15:50 (0)
Студентам / Tony_Montana
Информация про криптовалюту. — 2019-04-18 04:38:31 (6)
Общалка :) / PotapShavanov
ссылка на гидру зеркало — 2019-04-17 11:53:53 (0)
Базы данных / Tony_Montana
гидра сайт доверенных — 2019-04-16 13:58:20 (0)
Фриланс / Tony_Montana
Delphi Trichview замена текста — 2019-04-16 13:02:35 (0)
Delphi & Kylix / ale-sumkin
Реально ли заработать на ставках? — 2019-04-16 07:34:02 (5)
Общалка :) / Polernik

Показать новые сообщения »

Почтовая рассылка

PDF parser library

32K

21 августа 2008 года

13 / / 11.05.2008

Доброго времени суток.
Поскажите, пожалуйста (поделитесь опытом) библиотеку для парсинга PDF.
От библиотеки требуется извлекать из пдфки текст (его фонт, цвет, размер) в порядке, в котором он идёт в пдфке(!!). Помимо этого, текст должен извлекаться не странично, а по абзацам (например, идёт title, затем 5 абзацев, должно получиться 6 кусков текста), желательно, чтобы извлекалась инфа о пдфке (автора, чем создана и тп).
Проект пишется на С++ в MS VisualStudio 2005.
На данный момент используется стандартный COM'овский парсер документов(для индексирования) - IFIlter. Он, как раз, выдирает куски постранично и совсем не сохраняет инфу о фонтах.
Из того, что нагуглил, подходит Xpdf, однако, я не нашёл библиотку под win, только сэмплы, да парсит он иногда не совсем корректно.
спасибо за помощь..

Подписаться на вопросНеобходима регистрация

По порядку

Сначала полезные

Сначала решения

1 ответ

40K

23 августа 2008 года

17 / / 23.08.2008

По моему в среде GSTools было что-то подобное.

Цитировать

Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог