PDF adalah format file yang digunakan untuk menyajikan dokumen dengan cara yang independen dari perangkat lunak aplikasi, perangkat keras, dan sistem operasi yang digunakan untuk membuat atau melihatnya. Namun, PDF tidak mudah diedit dan tidak cocok untuk halaman web. Mengonversi PDF ke HTML memungkinkan konten dokumen mudah diedit, dicari, dan diindeks oleh mesin pencari, dan memungkinkan dokumen lebih mudah dilihat di web. Pada artikel ini, kita akan mempelajari cara mengubah dokumen PDF menjadi format PDF menggunakan C#.

Konversi PDF ke HTML di CSharp.

.NET API untuk Mengonversi File PDF ke HTML

GroupDocs menyediakan solusi konversi dokumen untuk memberdayakan pengembang dengan otomatisasi. Ini membantu pemrogram dalam konversi berbagai dokumen dan format gambar dengan .NET API yang efisien dan andal. Hari ini, saya akan menggunakan API GroupDocs.Conversion for .NET untuk mengubah dokumen PDF menjadi format HTML.

Anda dapat mengunduh penginstal DLL atau MSI dari bagian unduhan atau menginstal API di aplikasi .NET Anda melalui NuGet.

PM> Install-Package GroupDocs.Conversion

Cara Mengonversi PDF ke HTML menggunakan C#

Mari kita mulai dengan konversi dasar file PDF ke dalam format HTML menggunakan C#. Langkah-langkah berikut mengubah semua halaman file PDF menjadi HTML.

  • Muat file PDF menggunakan kelas Converter.
  • Panggil metode Konversi untuk mengubah dokumen yang dimuat menjadi format PDF.

Kode C# berikut mengubah seluruh dokumen PDF menjadi HTML.

using GroupDocs.Conversion.Options.Convert;
...

// Konversi PDF ke HTML menggunakan C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

Konversikan Halaman Terpilih dari Dokumen PDF yang Dilindungi Kata Sandi menggunakan C#

Anda juga dapat mengonversi dokumen PDF yang dilindungi atau dikunci. Langkah-langkah berikut menunjukkan cara mengonversi halaman selektif dari dokumen PDF yang dikunci ke dalam format HTML menggunakan C#.

  • Persiapkan opsi pemuatan menggunakan kelas PdfLoadOptions.
  • Sekarang, muat file PDF menggunakan kelas Converter.
  • Persiapkan opsi konversi untuk format HTML menggunakan kelas WebConvertOptions.
  • Tentukan daftar halaman kandidat konversi menggunakan Pages, PageNumber, PageCount, Zoom, dan properti lainnya.
  • Terakhir, gunakan metode Konversi untuk mengubah file PDF yang dimuat ke dalam format HTML.

Kode C# berikut mengonversi halaman yang dipilih dari dokumen PDF yang dilindungi kata sandi menjadi HTML.

// Ubah halaman terpilih dari PDF yang dilindungi kata sandi ke HTML menggunakan C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // Siapkan opsi konversi
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
Keluaran PDF ke HTML

Kesimpulan

Sebagai penutup artikel, kami membahas konversi PDF ke HTML menggunakan C#. Kami secara terpisah menerapkan dua konversi yang berbeda. Pertama, kami mengonversi seluruh dokumen menggunakan opsi konversi default. Selanjutnya, kami mengonversi halaman terpilih dari dokumen yang dilindungi kata sandi menjadi HTML menggunakan .NET API yang sama.

Anda dapat mempelajari lebih lanjut tentang .NET Conversion Automation API menggunakan dokumentasi, Referensi API, atau dengan mencoba contoh GitHub. Anda dapat menghubungi kami untuk pertanyaan apa pun melalui forum.

Lihat juga