Portable Document Format (PDF) è un formato di documento popolare e ampiamente utilizzato sviluppato da Adobe. I documenti PDF possono contenere una varietà di contenuti tra cui testo formattato, immagini, annotazioni, campi modulo, ecc. L’analisi dei documenti PDF a livello di codice è un caso d’uso popolare e ci sono diversi modi per estrarre il testo. Tuttavia, l’estrazione di immagini da un documento PDF è un’attività complessa. Questo articolo illustra la facilità con cui è possibile estrarre immagini da documenti PDF a livello di programmazione in C#.
Estrai immagini dai documenti usando C#
In questo articolo impareremo a estrarre a livello di codice immagini da documenti PDF, Excel, PowerPoint e Word in un’applicazione C# utilizzando l’API .NET per l’analisi dei documenti. [GroupDocs.Parser for .NET][1] è l’analisi di documenti e l’estrazione di dati .NET API. Supporta l’analisi dei documenti e l’estrazione di immagini, testo e metadati da documenti di elaborazione testi, fogli di calcolo, presentazioni, archivi e e-mail documenti.