PDF is een bestandsindeling die wordt gebruikt om documenten te presenteren op een manier die onafhankelijk is van de toepassingssoftware, hardware en het besturingssysteem dat wordt gebruikt om ze te maken of te bekijken. PDF’s zijn echter niet gemakkelijk te bewerken en zijn niet erg geschikt voor webpagina’s. Door een PDF naar HTML te converteren, kan de inhoud van het document eenvoudig worden bewerkt, doorzocht en geïndexeerd door zoekmachines, en kan het document gemakkelijker op internet worden bekeken. In dit artikel leren we hoe u PDF-documenten kunt converteren naar PDF-indeling met behulp van C#.

Converteer PDF naar HTML in CSharp.

.NET API om PDF-bestanden naar HTML te converteren

GroupDocs biedt een oplossing voor documentconversie om ontwikkelaars te voorzien van automatisering. Het helpt programmeurs bij de conversie van verschillende documenten en beeldformaten met zijn efficiënte en betrouwbare .NET API. Vandaag zal ik de GroupDocs.Conversion for .NET API gebruiken om PDF-documenten naar HTML-indeling te converteren.

U kunt de DLL’s of het MSI-installatieprogramma downloaden van de downloadsectie of de API in uw .NET-toepassing installeren via NuGet.

PM> Install-Package GroupDocs.Conversion

Hoe een PDF naar HTML te converteren met C#

Laten we beginnen met de basisconversie van een PDF-bestand naar HTML-indeling met behulp van C#. De volgende stappen zetten alle pagina’s van een PDF-bestand om in HTML.

  • Laad het PDF-bestand met de klasse Converter.
  • Roep de Convert-methode aan om het geladen document om te zetten in PDF-indeling.

De volgende C#-code converteert het hele PDF-document naar HTML.

using GroupDocs.Conversion.Options.Convert;
...

// Converteer PDF naar HTML met C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

Converteer geselecteerde pagina’s van met een wachtwoord beveiligde PDF-documenten met behulp van C#

U kunt ook beveiligde of vergrendelde PDF-documenten converteren. De volgende stappen laten zien hoe u selectieve pagina’s van een vergrendeld PDF-document converteert naar HTML-indeling met behulp van C#.

  • Bereid de laadopties voor met behulp van de klasse PdfLoadOptions.
  • Laad nu het PDF-bestand met behulp van de klasse Converter.
  • Bereid de conversie-opties voor de HTML-indeling voor met behulp van de klasse WebConvertOptions.
  • Definieer de lijst met conversiekandidaatpagina’s met behulp van Pages, PageNumber, PageCount, Zoom en andere eigenschappen.
  • Gebruik ten slotte de Convert-methode om het geladen PDF-bestand om te zetten in HTML-indeling.

De volgende C#-code converteert de geselecteerde pagina’s van het met een wachtwoord beveiligde PDF-document naar HTML.

// Converteer geselecteerde pagina's van met een wachtwoord beveiligde PDF naar HTML met behulp van C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // Bereid conversie-opties voor
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
PDF naar HTML-uitvoer

Conclusie

Om het artikel af te sluiten, bespraken we de conversie van PDF naar HTML met behulp van C#. We hebben afzonderlijk twee verschillende conversies geïmplementeerd. Eerst hebben we het hele document geconverteerd met behulp van de standaard conversie-opties. Bovendien hebben we de geselecteerde pagina’s van een met een wachtwoord beveiligd document geconverteerd naar HTML met behulp van dezelfde .NET API.

U kunt meer leren over de .NET Conversion Automation API met behulp van de documentatie, API-referentie of door de GitHub-voorbeelden te ervaren. U kunt ons voor elke vraag bereiken via het forum.

Zie ook