Portable Document Format (PDF) is een populair en veelgebruikt documentformaat ontwikkeld door Adobe. PDF-documenten kunnen een verscheidenheid aan inhoud bevatten, waaronder opgemaakte tekst, afbeeldingen, annotaties, formuliervelden, enz. Het programmatisch ontleden van PDF-documenten is een populaire use-case en er zijn meerdere manieren om de tekst te extraheren. Het extraheren van afbeeldingen uit een PDF-document is echter een complexe taak. Dit artikel laat zien hoe eenvoudig u programmatisch afbeeldingen uit PDF-documenten kunt extraheren in C#.
Extraheer afbeeldingen uit documenten met C#
In dit artikel leren we afbeeldingen programmatisch te extraheren uit PDF-, Excel-, PowerPoint- en Word-documenten in een C#-toepassing met behulp van documentparsing .NET API. [GroupDocs.Parser for .NET][1] is de .NET API voor documentparsing en gegevensextractie. Het ondersteunt het parseren en extraheren van afbeeldingen, tekst en metagegevens uit tekstverwerkingsdocumenten, spreadsheets, presentaties, archieven en e-maildocumenten.