Portable Document Format (PDF) é um formato de documento popular e amplamente utilizado desenvolvido pela Adobe. Documentos PDF podem conter uma variedade de conteúdo, incluindo texto formatado, imagens, anotações, campos de formulário, etc. Analisar documentos PDF programaticamente é um caso de uso popular e há várias maneiras de extrair o texto. No entanto, extrair imagens de um documento PDF é uma tarefa complexa. Este artigo demonstra como é fácil extrair imagens de documentos PDF programaticamente em C#.
Extraia imagens de documentos usando C#
Neste artigo, aprenderemos a extrair programaticamente imagens de documentos PDF, Excel, PowerPoint e Word em um aplicativo C# usando a API .NET de análise de documentos. [GroupDocs.Parser for .NET][1] é uma API .NET para análise de documentos e extração de dados. Ele é compatível com análise de documentos e extração de imagens, texto e metadados de documentos de processamento de texto, planilhas, apresentações, arquivos e e-mail documentos.