Видобування зображень із PDF-документів за допомогою C#
Portable Document Format (PDF) — популярний і широко використовуваний формат документів, розроблений Adobe. PDF-документи можуть містити різноманітний вміст, зокрема відформатований текст, зображення, анотації, поля форми тощо. Програмний аналіз PDF-документів є популярним випадком використання, і існує кілька способів вилучення тексту. Однак вилучення зображень із документа PDF є складним завданням. Ця стаття демонструє, як легко програмно витягувати зображення з PDF-документів на C#.
Вилучення зображень із документів за допомогою C#
У цій статті ми навчимося програмно видобувати зображення з документів PDF, Excel, PowerPoint і Word у програмі C# за допомогою аналізу документів .NET API. [GroupDocs.Parser for .NET][1] — це API для аналізу документів і вилучення даних. Він підтримує розбір документів і вилучення зображень, тексту та метаданих із текстових документів, електронних таблиць, презентацій, архівів та документів електронної пошти.