Converter DOCX para HTML em CSharp

Ou você deseja converter um documento para o formato HTML para obter o conteúdo do seu site ou se deparou com um site de envio de documentos on-line que exige que os documentos sejam enviados no formato HTML. Em ambos os casos, você precisa de um conversor de DOC para HTML. No entanto, se você precisar converter seus documentos para HTML programaticamente, este artigo é apenas para você. Este artigo abordará as seguintes maneiras de converter documentos em HTML em C#:

  • Conversão mais simples de documentos como DOCX para HTML em C#.
  • Converta para HTML com opções personalizadas.
  • Converta usando a opção de mostrar ou ocultar as bordas da página.

Biblioteca de conversão de documentos C#

GroupDocs.Conversion for .NET é uma API poderosa e fácil de usar com a capacidade de converter qualquer documento da ampla lista de formatos de documento suportados em qualquer formato de destino suportado. Você pode baixar a API da seção downloads ou instalá-la em NuGet.

Converter DOCX para HTML em C# - Simples

Esta é a conversão mais simples e muito útil. É melhor dizer que você pode converter qualquer um dos seus documentos para o formato HTML. Basta verificar seu formato na lista de formatos suportados e seguir em frente para convertê-lo.

Seu documento será convertido para HTML e o documento resultante estará lá em seu repositório. O pequeno exemplo de código a seguir mostra a conversão de um arquivo DOCX em HTML usando a classe Converter em C#.

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

Converta DOC/DOCX para HTML com opções personalizadas

GroupDocs.Conversion oferece outras opções diferentes para obter o resultado de conversão desejado. As opções personalizadas incluem:

  • Esquema Fixo
  • Layout Fixo - Mostrar Bordas
  • Formato
  • Número de página
  • Páginas
  • Contagem de páginas
  • Usar PDF
  • Marca d’água
  • Ampliação

Você pode visitar a documentação ou amostras do GitHub para ver cada opção em detalhes. Mostrarei algumas das personalizações ao converter novamente o formato DOCX para HTML no exemplo de código abaixo.

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

Converter DOC/DOCX para HTML - Mostrar ou ocultar as bordas da página

Por último, mas não menos importante, agora você pode controlar a visibilidade das bordas da página ao converter documentos em HTML em C#. O GroupDocs.Conversion para .NET dá esse controle aos programadores de C#. O exemplo abaixo mostra que, definindo a propriedade FixedLayoutShowBorders da classe MarkupConvertOptions como true ou false, você pode mostrar ou ocultar as bordas da página no documento HTML resultante.

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

Imagens abaixo mostrando o documento DOCX original e o HTML convertido com e sem bordas de página.

Documento Docx para converter em HTML

Documento DOCX Original

Arquivo HTML com bordas de página e sem bordas.

A figura acima mostra os arquivos HTML que são convertidos de DOCX com bordas de exibição e não mostram opções de bordas.

Saiba mais sobre GroupDocs.Conversion

Vamos conversar mais @ Fórum de suporte gratuito.