PDF je formát souboru, který se používá k prezentaci dokumentů způsobem, který je nezávislý na aplikačním softwaru, hardwaru a operačním systému použitém k jejich vytvoření nebo zobrazení. Soubory PDF však nelze snadno upravovat a nejsou vhodné pro webové stránky. Převod PDF do HTML umožňuje snadno upravovat obsah dokumentu, vyhledávat a indexovat vyhledávači a umožňuje snadnější prohlížení dokumentu na webu. V tomto článku se naučíme, jak převést dokumenty PDF do formátu PDF pomocí C#.

Převeďte PDF do HTML v CSharp.

.NET API pro převod souborů PDF do HTML

GroupDocs poskytuje řešení pro převod dokumentů, které umožňuje vývojářům automatizaci. Pomáhá programátorům při převodu různých dokumentů a obrazových formátů pomocí efektivního a spolehlivého .NET API. Dnes použiji jeho GroupDocs.Conversion for .NET API pro převod dokumentů PDF do formátu HTML.

Můžete si stáhnout DLL nebo instalační program MSI z části ke stažení nebo nainstalovat API do vaší aplikace .NET prostřednictvím NuGet.

PM> Install-Package GroupDocs.Conversion

Jak převést PDF do HTML pomocí C#

Začněme základní převodem PDF souboru do HTML formátu pomocí C#. Následující kroky převedou všechny stránky souboru PDF do HTML.

  • Načtěte soubor PDF pomocí třídy Converter.
  • Voláním metody Convert převedete načtený dokument do formátu PDF.

Následující kód C# převede celý dokument PDF do HTML.

using GroupDocs.Conversion.Options.Convert;
...

// Převod PDF do HTML pomocí C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

Převést vybrané stránky dokumentů PDF chráněných heslem pomocí C#

Můžete také převádět chráněné nebo zamčené dokumenty PDF. Následující kroky ukazují, jak převést vybrané stránky zamčeného dokumentu PDF do formátu HTML pomocí C#.

  • Připravte volby načítání pomocí třídy PdfLoadOptions.
  • Nyní načtěte soubor PDF pomocí třídy Converter.
  • Připravte volby převodu pro formát HTML pomocí třídy WebConvertOptions.
  • Definujte seznam stránek kandidátů na konverzi pomocí Pages, PageNumber, PageCount, Zoom a dalších vlastností.
  • Nakonec použijte metodu Převést k transformaci načteného souboru PDF do formátu HTML.

Následující kód C# převede vybrané stránky dokumentu PDF chráněného heslem do HTML.

// Převeďte vybrané stránky PDF chráněného heslem do HTML pomocí C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // Připravte možnosti převodu
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
Výstup z PDF do HTML

Závěr

Na závěr článku jsme diskutovali o převodu PDF do HTML pomocí C#. Samostatně jsme implementovali dvě různé konverze. Nejprve jsme celý dokument převedli pomocí výchozích možností převodu. Dále jsme pomocí stejného .NET API převedli vybrané stránky dokumentu chráněného heslem do HTML.

Další informace o rozhraní .NET Conversion Automation API můžete získat pomocí dokumentace, Odkaz na rozhraní API nebo si můžete vyzkoušet příklady GitHubu. S jakýmkoliv dotazem nás můžete kontaktovat prostřednictvím fóra.

Viz také