Portable Document Format (PDF) ist ein beliebtes und weit verbreitetes Dokumentformat, das von Adobe entwickelt wurde. PDF-Dokumente können eine Vielzahl von Inhalten enthalten, darunter formatierten Text, Bilder, Anmerkungen, Formularfelder usw. Das programmgesteuerte Analysieren von PDF-Dokumenten ist ein beliebter Anwendungsfall, und es gibt mehrere Möglichkeiten, den Text zu extrahieren. Das Extrahieren von Bildern aus einem PDF-Dokument ist jedoch eine komplexe Aufgabe. Dieser Artikel zeigt, wie einfach Sie Bilder aus PDF-Dokumenten programmgesteuert in C# extrahieren können.
Bilder aus Dokumenten mit C# extrahieren
In diesem Artikel lernen wir, Bilder aus PDF-, Excel-, PowerPoint- und Word-Dokumenten programmgesteuert in einer C#-Anwendung mithilfe der .NET-API zum Analysieren von Dokumenten zu extrahieren. [GroupDocs.Parser for .NET][1] ist eine .NET-API zum Analysieren von Dokumenten und zum Extrahieren von Daten. Es unterstützt Dokumentparsing und Extrahieren von Bildern, Text und Metadaten aus Textverarbeitungsdokumenten, Tabellenkalkulationen, Präsentationen, Archiven und E-Mail Dokumente.