Как вытащить картинку из pdf при помощи iTextSharp

75K

10 октября 2011 года

3 / / 10.10.2011

Добры день!
Я использую библиотеку iTextSharp. Я пытаюсь достать при помощи этой библиотеки все картинки из pdf файла. Проблема заключается в том, что я не могу получить картинку, которая имеет тип компрессии JPXDecode при считывании массив байтов (bytes) == 0; Почему? Я так полагаю, что надо как-то по-другому получить массив байт используя фильтр JPXDecode, но как?? Помогите найти решение! спасибо!

Свернуть исходник

Код:

private static List<System.Drawing.Image> ExtractImages(String PDFSourcePath)

        {

            List<System.Drawing.Image> ImgList = new List<System.Drawing.Image>();

            iTextSharp.text.pdf.RandomAccessFileOrArray RAFObj = null;

            iTextSharp.text.pdf.PdfReader PDFReaderObj = null;

            iTextSharp.text.pdf.PdfObject PDFObj = null;

            iTextSharp.text.pdf.PdfStream PDFStremObj = null;

            try

            {

                RAFObj = new iTextSharp.text.pdf.RandomAccessFileOrArray(PDFSourcePath);

                PDFReaderObj = new iTextSharp.text.pdf.PdfReader(RAFObj, null);

                for (int i = 0; i <= PDFReaderObj.XrefSize - 1; i++)

                {

                    PDFObj = PDFReaderObj.GetPdfObject(i);

                    if ((PDFObj != null) && PDFObj.IsStream())

                    {

                        PDFStremObj = (iTextSharp.text.pdf.PdfStream)PDFObj;

                        iTextSharp.text.pdf.PdfObject subtype = PDFStremObj.Get(iTextSharp.text.pdf.PdfName.SUBTYPE);

                        if ((subtype != null) && subtype.ToString() == iTextSharp.text.pdf.PdfName.IMAGE.ToString())

                        {

                            byte[] bytes = iTextSharp.text.pdf.PdfReader.GetStreamBytesRaw((iTextSharp.text.pdf.PRStream)PDFStremObj);

                            if ((bytes != null))

                            {

                                try

                                {

                                    System.IO.MemoryStream MS = new System.IO.MemoryStream(bytes);

                                    MS.Position = 0;

                                    System.Drawing.Image ImgPDF = System.Drawing.Image.FromStream(MS);

                                    ImgList.Add(ImgPDF);

                                }

                                catch (Exception)

                                {

                                }

                            }

                        }

                    }

                }

                PDFReaderObj.Close();

            }

            catch (Exception ex)

            {

                throw new Exception(ex.Message);

            }

            return ImgList;

        }

Подписаться на вопросНеобходима регистрация

По порядку

Сначала полезные

Сначала решения

2 ответа

0 спам

10 октября 2011 года

Phodopus

3.3K / / 19.06.2008

Если картинки, положим, других типов считываются нормально, то это скорее всего проблема самой библиотеки

Цитировать

0 спам

75K

11 октября 2011 года

Danone

3 / / 10.10.2011

В этой библиотеке есть фильтры, при помощи которых, наверно, можно было бы раскодировать этот поток и получить изображение в формате System.Drawing.Image. Но как? Есть ли у кого опыт работы с этой библиотекой?!

Цитировать

Ваш аккаунт

Последние темы форума

Почтовая рассылка

Как вытащить картинку из pdf при помощи iTextSharp

2 ответа