Định dạng Tài liệu Di động (PDF) là một định dạng tài liệu phổ biến và được sử dụng rộng rãi do Adobe phát triển. Tài liệu PDF có thể chứa nhiều loại nội dung bao gồm văn bản được định dạng, hình ảnh, chú thích, trường biểu mẫu, v.v. Phân tích cú pháp tài liệu PDF theo chương trình là một trường hợp sử dụng phổ biến và có nhiều cách để trích xuất văn bản. Tuy nhiên, trích xuất hình ảnh từ tài liệu PDF là một nhiệm vụ phức tạp. Bài viết này trình bày cách dễ dàng bạn có thể trích xuất hình ảnh từ tài liệu PDF bằng lập trình trong C#.
Trích xuất hình ảnh từ tài liệu bằng C#
Trong bài viết này, chúng ta sẽ học cách lập trình trích xuất hình ảnh từ các tài liệu PDF, Excel, PowerPoint và Word trong ứng dụng C# bằng cách sử dụng phân tích cú pháp tài liệu .NET API. [GroupDocs.Parser for .NET][1] là phân tích cú pháp tài liệu và trích xuất dữ liệu .NET API. Nó hỗ trợ phân tích cú pháp tài liệu và trích xuất hình ảnh, văn bản và siêu dữ liệu từ tài liệu soạn thảo văn bản, bảng tính, bản trình bày, tài liệu lưu trữ và tài liệu email.