PDF는 문서를 만들거나 보는 데 사용되는 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 방식으로 문서를 표시하는 데 사용되는 파일 형식입니다. 그러나 PDF는 쉽게 편집할 수 없으며 웹 페이지에 적합하지 않습니다. PDF를 HTML로 변환하면 문서의 내용을 검색 엔진에서 쉽게 편집, 검색 및 색인화할 수 있으며 문서를 웹에서 더 쉽게 볼 수 있습니다. 이 기사에서는 C#을 사용하여 PDF 문서를 PDF 형식으로 변환하는 방법을 배웁니다.

CSharp에서 PDF를 HTML로 변환합니다.

PDF 파일을 HTML로 변환하는 .NET API

GroupDocs는 개발자에게 자동화 기능을 제공하는 문서 변환 솔루션을 제공합니다. 효율적이고 안정적인 .NET API를 통해 프로그래머가 다양한 문서 및 이미지 형식을 변환할 수 있도록 도와줍니다. 오늘은 GroupDocs.Conversion for .NET API를 사용하여 PDF 문서를 HTML 형식으로 변환하겠습니다.

다운로드 섹션에서 DLL 또는 MSI 설치 프로그램을 다운로드하거나 NuGet을 통해 .NET 애플리케이션에 API를 설치할 수 있습니다.

PM> Install-Package GroupDocs.Conversion

C#을 사용하여 PDF를 HTML로 변환하는 방법

C#을 사용하여 PDF 파일을 HTML 형식으로 변환하는 기본 작업부터 시작하겠습니다. 다음 단계는 PDF 파일의 모든 페이지를 HTML로 변환합니다.

  • Converter 클래스를 사용하여 PDF 파일을 로드합니다.
  • Convert 메서드를 호출하여 로드된 문서를 PDF 형식으로 변환합니다.

다음 C# 코드는 전체 PDF 문서를 HTML로 변환합니다.

using GroupDocs.Conversion.Options.Convert;
...

// C#을 사용하여 PDF를 HTML로 변환
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

C#을 사용하여 암호로 보호된 PDF 문서의 선택한 페이지 변환

보호되거나 잠긴 PDF 문서를 변환할 수도 있습니다. 다음 단계는 C#을 사용하여 잠긴 PDF 문서의 일부 페이지를 HTML 형식으로 변환하는 방법을 보여줍니다.

  • PdfLoadOptions 클래스를 사용하여 로딩 옵션을 준비합니다.
  • 이제 Converter 클래스를 사용하여 PDF 파일을 로드합니다.
  • WebConvertOptions 클래스를 사용하여 HTML 형식에 대한 변환 옵션을 준비합니다.
  • Pages, PageNumber, PageCount, Zoom 및 기타 속성을 사용하여 전환 후보 페이지 목록을 정의합니다.
  • 마지막으로 Convert 메서드를 사용하여 로드된 PDF 파일을 HTML 형식으로 변환합니다.

다음 C# 코드는 암호로 보호된 PDF 문서의 선택된 페이지를 HTML로 변환합니다.

// C#을 사용하여 암호로 보호된 PDF의 선택한 페이지를 HTML로 변환

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // 변환 옵션 준비
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
PDF를 HTML로 출력

결론

기사를 마무리하기 위해 C#을 사용하여 PDF를 HTML로 변환하는 방법에 대해 논의했습니다. 두 가지 변환을 별도로 구현했습니다. 먼저 기본 변환 옵션을 사용하여 전체 문서를 변환했습니다. 또한 동일한 .NET API를 사용하여 암호로 보호된 문서의 선택된 페이지를 HTML로 변환했습니다.

문서, API 참조를 사용하거나 GitHub 예제를 경험하여 .NET 변환 자동화 API에 대해 자세히 알아볼 수 있습니다. 포럼을 통해 모든 질문에 대해 문의하실 수 있습니다.

또한보십시오