Konwertuj DOCX na HTML w CSharp

Albo chcesz przekonwertować dokument do formatu HTML, aby uzyskać zawartość swojej witryny, albo natknąłeś się na witrynę internetową do przesyłania dokumentów, która wymaga przesyłania dokumentów w formacie HTML. W obu przypadkach potrzebujesz konwertera DOC na HTML. Jeśli jednak potrzebujesz programowo przekonwertować dokumenty do formatu HTML, ten artykuł jest przeznaczony tylko dla Ciebie. W tym artykule omówiono następujące sposoby konwertowania dokumentów do formatu HTML w języku C#:

  • Najprostsza konwersja dokumentów takich jak DOCX do HTML w C#.
  • Konwertuj na HTML z niestandardowymi opcjami.
  • Konwertuj za pomocą opcji pokazywania lub ukrywania obramowań strony.

Biblioteka konwersji dokumentów C#

GroupDocs.Conversion for .NET to łatwy w użyciu, potężny interfejs API z możliwością konwersji dowolnego dokumentu z szerokiej listy obsługiwanych formatów dokumentów na dowolne obsługiwane formaty docelowe. Możesz pobrać API z sekcji downloads lub zainstalować z NuGet.

Konwertuj DOCX na HTML w C# - Proste

To najprostsza i bardzo użyteczna konwersja. Lepiej powiem, że możesz przekonwertować dowolny dokument do formatu HTML. Po prostu sprawdź swój format na liście obsługiwanych formatów i kontynuuj konwersję.

  • Utwórz instancję klasy Converter, aby rozpocząć od dokumentu źródłowego.
  • Utwórz instancję obiektu MarkupConvertOptions.
  • Wywołaj metodę Convert klasy Converter.
  • Otóż to.

Twój dokument zostanie przekonwertowany na HTML, a wynikowy dokument znajdzie się w twoim repozytorium. Poniższy mały przykładowy kod przedstawia konwersję pliku DOCX do formatu HTML przy użyciu klasy Converter w języku C#.

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

Konwertuj DOC/DOCX na HTML z niestandardowymi opcjami

GroupDocs.Conversion zapewnia różne inne opcje, aby uzyskać pożądany wynik konwersji. Dostosowane opcje obejmują:

  • Naprawiono układ
  • Naprawiono układ - Show Borders
  • Format
  • Numer strony
  • Strony
  • Strony Count
  • Użyj PDF’a
  • znak wodny
  • Powiększenie

Możesz odwiedzić dokumentację lub przykłady GitHub, aby zobaczyć szczegółowo każdą opcję. Pokażę niektóre dostosowania podczas ponownej konwersji formatu DOCX na HTML w poniższym przykładzie kodu.

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

Konwertuj DOC/DOCX na HTML - Pokaż lub ukryj obramowania strony

Wreszcie, możesz teraz kontrolować widoczność obramowań stron podczas konwertowania dokumentów do formatu HTML w języku C#. GroupDocs.Conversion for .NET daje tę kontrolę programistom języka C#. Poniższy przykład pokazuje, że ustawiając właściwość FixedLayoutShowBorders klasy MarkupConvertOptions na wartość true lub false, można pokazać lub ukryć obramowania strony w wynikowym dokumencie HTML.

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

Obrazy poniżej przedstawiające oryginalny dokument DOCX i przekonwertowany kod HTML z obramowaniem strony i bez.

Docx do przekonwertowania na format HTML

Oryginalny dokument DOCX

Plik HTML z obramowaniami stron i bez obramowań.

Powyższy rysunek pokazuje pliki HTML, które zostały przekonwertowane z DOCX z opcjami pokazywania obramowań i bez pokazywania obramowań.

Dowiedz się więcej o GroupDocs.Conversion

Porozmawiajmy więcej @ Free Support Forum.