Извлечение изображений из PDF-документов с помощью C#
Portable Document Format (PDF) — популярный и широко используемый формат документов, разработанный Adobe. PDF-документы могут содержать разнообразный контент, включая форматированный текст, изображения, аннотации, поля форм и т. д. Программный анализ PDF-документов является популярным вариантом использования, и существует несколько способов извлечения текста. Однако извлечение изображений из PDF-документа — сложная задача. В этой статье показано, как легко можно программно извлекать изображения из PDF-документов на C#.
Извлечение изображений из документов с помощью C#
В этой статье мы научимся программно извлекать изображения из документов PDF, Excel, PowerPoint и Word в приложении C#, используя .NET API для анализа документов. [GroupDocs.Parser for .NET][1] — это .NET API для разбора документов и извлечения данных. Он поддерживает анализ документов и извлечение изображений, текста и метаданных из текстовых документов, электронных таблиц, презентаций, архивов и отправить документы.