eBook으로 널리 알려진 전자책은 다양한 전자 기기에서 읽을 수 있는 디지털 형태의 책입니다. 이러한 장치에는 Kindle과 같은 전용 eReader 또는 랩톱, 데스크톱 컴퓨터 및 스마트폰이 포함됩니다. 다음을 포함하여 시장에서 널리 사용되는 eBook 파일 형식이 많이 있습니다. EPUB, FictionBook FB2, Microsoft Compiled HTML Help - CHM, DjVu, MOBI, PDF 및 기타 여러 가지. 프로그래머로서 이 기사는 .NET 애플리케이션 내에서 **C#의 eBook에서 프로그래밍 방식으로 이미지를 추출하는 데 도움이 됩니다.

아래에서 다음 주제를 다룹니다.

eBook에서 이미지 추출을 위한 .NET API

eBook에서 이미지를 추출하기 위해 이 기사의 C# 예제에서 GroupDocs.Parser for .NET API를 사용할 것입니다. eBook과 함께 이 API는 워드 프로세서 문서, 스프레드시트, PDF, 프레젠테이션, 이메일, ZIP 아카이브 및 기타 여러 문서 형식에서 이미지의 구문 분석 및 추출을 지원합니다.

다운로드 섹션에서 DLL 또는 MSI 설치 프로그램을 다운로드하거나 NuGet을 통해 .NET 애플리케이션에 API를 설치할 수 있습니다.

PM> Install-Package GroupDocs.Parser

C#의 EPUB eBook에서 이미지 추출

EPUB eBook으로 시작하여 이미지를 구문 분석해 보겠습니다. C# 코드 다음에 오는 단계는 EPUB eBook을 구문 분석하고 그 안의 모든 이미지를 추출합니다.

  • Parser 클래스 객체를 생성합니다.
  • GetImages 메소드를 사용하여 EPUB eBook의 모든 이미지를 추출합니다.
  • 추출된 이미지를 하나씩 탐색하여 저장합니다.
앨리스 EPUB

Adobe의 EPUB eBook [샘플 eBook 라이브러리][12]

다음 C# 코드는 위에 표시된 EPUB eBook을 구문 분석하고 추출 이미지를 디스크에 하나씩 저장하기 위해 언급된 구문 분석 단계를 구현합니다.

// eBook을 구문 분석하여 EPUB, FB2, CHM 파일에서 이미지를 추출하고 C#으로 디스크에 저장
using (Parser parser = new Parser("ebook.epub"))
{
    // eBook에서 이미지 추출
    IEnumerable<PageImageArea> images = parser.GetImages();
    ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
    int imageNumber = 0;
    // 추출된 이미지 반복
    foreach (PageImageArea image in images)
    {
        image.Save(("Image-" + imageNumber.ToString() + image.FileType.Extension), options);
        imageNumber++;
    }
}
C#의 EPUB에서 이미지 추출

결과적으로 사용 가능한 모든 이미지가 저장됩니다. 다음은 샘플로 표시된 이미지 중 하나입니다.

추출된 이미지는 지원되는 다음 이미지 파일 형식으로 저장할 수 있습니다.

  • JPG
  • PNG
  • 웹프
  • GIF
  • BMP

C#의 FB2, CHM eBook에서 이미지 추출

FB2, CHM 또는 다른 형식의 eBook이 있는 경우 동일한 방식으로 이미지를 추출할 수 있습니다. 객체를 생성하는 동안 eBook을 Parser 생성자에 전달하기만 하면 됩니다. 그런 다음 GetImages 메서드는 동일한 C# 코드를 사용하여 제공된 eBook에서 이미지를 추출합니다.

// Pass the FB2, CHM, PDF, or any other eBook to Parser contructor
Parser parser = new Parser("ebook.fb2"); // FB2
// Parser parser = new Parser("ebook.chm"); // CHM
// Parser parser = new Parser("ebook.pdf"); // PDF
IEnumerable<PageImageArea> images = parser.GetImages();

결론

이제 .NET 응용 프로그램 내에서 EPUB, FB2, CHM 및 기타 파일 형식이 포함된 eBook의 모든 이미지를 프로그래밍 방식으로 편안하게 얻을 수 있기를 바랍니다. GroupDocs.Parser for .NET API를 사용하여 고유한 이미지 추출기 애플리케이션을 구축할 수도 있습니다.

API에 대한 자세한 내용은 문서를 방문하거나 GitHub의 오픈 소스 예제를 참조하십시오. 추가 문제가 있는 경우 포럼에서 빠른 지원에 문의할 수 있습니다.

또한보십시오