CSharp에서 DOCX를 HTML로 변환

웹 사이트의 콘텐츠를 얻기 위해 문서를 HTML 형식으로 변환하려고 하거나 문서를 HTML 형식으로 제출해야 하는 온라인 문서 제출 웹사이트를 접했습니다. 두 경우 모두 DOC에서 HTML로의 변환기가 필요합니다. 그러나 문서를 프로그래밍 방식으로 HTML로 변환해야 하는 경우 이 문서는 당신만을 위한 것입니다. 이 문서에서는 C#에서 문서를 HTML로 변환하는 다음 방법을 다룹니다.

  • C#에서 DOCX와 같은 문서를 HTML로 가장 간단하게 변환합니다.
  • 사용자 정의 옵션을 사용하여 HTML로 변환합니다.
  • 페이지 테두리를 표시하거나 숨기는 옵션을 사용하여 변환합니다.

C# 문서 변환 라이브러리

GroupDocs.Conversion for .NET지원되는 문서 형식의 광범위한 목록에서 지원되는 대상 형식으로 모든 문서를 변환할 수 있는 강력한 API를 사용하기 쉽습니다. 다운로드 섹션에서 API를 다운로드하거나 NuGet에서 설치할 수 있습니다.

C#에서 DOCX를 HTML로 변환 - 단순

이것은 가장 간단하고 매우 유용한 변환입니다. 문서를 HTML 형식으로 변환할 수 있다고 말하는 것이 좋습니다. 지원되는 형식 목록에서 형식을 확인하고 변환을 받으십시오.

  • 소스 문서로 시작할 Converter 클래스의 인스턴스를 만듭니다.
  • MarkupConvertOptions 개체를 인스턴스화합니다.
  • Converter 클래스의 Convert 메서드를 호출합니다.
  • 그게 다야.

문서가 HTML로 변환되고 결과 문서가 저장소에 있습니다. 다음 작은 코드 샘플은 C#의 Converter 클래스를 사용하여 DOCX 파일을 HTML로 변환하는 방법을 보여줍니다.

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

사용자 정의 옵션을 사용하여 DOC/DOCX를 HTML로 변환

GroupDocs.Conversion은 원하는 변환 결과를 얻을 수 있는 다른 옵션을 제공합니다. 사용자 지정 옵션에는 다음이 포함됩니다.

  • 고정 레이아웃
  • 고정 레이아웃 - 테두리 표시
  • 형식
  • 페이지 번호
  • 페이지
  • 페이지 수
  • PDF 사용
  • 워터마크

문서 또는 GitHub 샘플을 방문하여 각 옵션을 자세히 볼 수 있습니다. 아래 코드 샘플에서 DOCX를 HTML 형식으로 다시 변환하는 동안 사용자 정의 중 일부를 보여 드리겠습니다.

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

DOC/DOCX를 HTML로 변환 - 페이지 테두리 표시 또는 숨기기

마지막으로 C#에서 문서를 HTML로 변환하는 동안 페이지 테두리의 가시성을 제어할 수 있습니다. .NET용 GroupDocs.Conversion은 C# 프로그래머에게 이 컨트롤을 제공합니다. 아래 예는 MarkupConvertOptions 클래스의 FixedLayoutShowBorders 속성을 true 또는 false로 설정하여 결과 HTML 문서에서 페이지 테두리를 표시하거나 숨길 수 있음을 보여줍니다.

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

원본 DOCX 문서와 페이지 테두리가 있거나 없는 변환된 HTML을 보여주는 아래 이미지.

HTML로 변환할 Docx 문서

원본 DOCX 문서

페이지 테두리가 있고 테두리가 없는 HTML 파일입니다.

위의 그림은 DOCX에서 테두리를 표시하고 테두리를 표시하지 않는 옵션으로 변환한 HTML 파일을 보여줍니다.

GroupDocs.Conversion에 대해 자세히 알아보기

더 이야기합시다 @ 무료 지원 포럼.