Di era digital saat ini, kemampuan untuk mengkonversi dokumen PDF ke format HTML menjadi semakin penting. Apakah Anda seorang pengembang yang sedang mengerjakan proyek yang memerlukan fungsi ini atau pengguna yang ingin membuat dokumen PDF lebih mudah diakses, memahami cara mengonversi PDF ke HTML di Java sangatlah penting. Dalam postingan blog ini, kami akan memandu Anda melalui proses konversi dokumen PDF ke HTML menggunakan Java.

Konversi PDF ke HTML di CSharp.

Pengembang Java: API Konversi PDF ke HTML

GroupDocs menampilkan API konversi dokumen & gambar untuk pengembang Java. Ini mendukung daftar besar format dokumen dan gambar untuk konversi dari satu format ke format lainnya. Selain itu, hasil konversi juga dapat disesuaikan menggunakan opsi lanjutan yang tersedia. Saya akan menggunakan API GroupDocs.Conversion for Java untuk mengonversi dokumen PDF ke format HTML.

Unduh atau Konfigurasi

Anda dapat mengunduh file JAR dari bagian unduhan, atau hanya mendapatkan konfigurasi repositori dan ketergantungan untuk pom.xml aplikasi Java berbasis maven Anda.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Cara Mengonversi PDF ke HTML menggunakan Java

Mengonversi PDF ke HTML menggunakan Java adalah proses yang mudah. Langkah-langkah berikut akan memandu Anda melalui proses mengonversi semua halaman file PDF ke dalam format HTML.

  • Gunakan kelas Converter untuk memuat file PDF.
  • Manfaatkan metode Konversi untuk mengubah dokumen yang dimuat ke dalam format HTML.

Kode berikut menunjukkan cara mengonversi seluruh dokumen PDF menjadi HTML menggunakan Java.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Konversi PDF ke HTML di Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Mengonversi Halaman Tertentu dari PDF Terjamin di Java

Mengonversi dokumen PDF yang dilindungi atau dikunci juga dimungkinkan. Langkah-langkah berikut akan memandu Anda melalui proses mengonversi halaman tertentu dari dokumen PDF yang dikunci ke dalam format HTML menggunakan Java.

  • Gunakan kelas PdfLoadOptions untuk menyiapkan opsi pemuatan.
  • Muat file PDF menggunakan kelas Converter.
  • Gunakan kelas WebConvertOptions untuk menyiapkan opsi konversi untuk format HTML.
  • Tentukan halaman tertentu yang akan dikonversi dengan mengatur properti seperti Pages, PageNumber, PageCount, Zoom, dll.
  • Terakhir, gunakan metode Konversi untuk mengubah file PDF yang dimuat ke dalam format HTML.

Kode Java berikut menunjukkan cara mengonversi halaman terpilih dari dokumen PDF yang dilindungi kata sandi menjadi HTML.

// Konversikan halaman terpilih dari PDF yang dilindungi kata sandi ke HTML di Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Kesimpulan

Singkatnya, artikel ini membahas topik mengonversi dokumen PDF ke HTML di Java. Kami melewati dua pendekatan berbeda, termasuk mengonversi seluruh dokumen dengan opsi default dan mengonversi halaman tertentu dari dokumen yang dilindungi kata sandi.

Untuk mempelajari lebih lanjut tentang Java Conversion Automation API, lihat dokumentasi, Referensi API, atau lihat contoh GitHub. Jika Anda memiliki pertanyaan lebih lanjut, jangan ragu untuk menghubungi kami melalui forum.

Lihat juga