در عصر دیجیتال امروزی، توانایی تبدیل اسناد PDF به فرمت HTML اهمیت فزاینده ای پیدا می کند. چه برنامه‌نویسی باشید که روی پروژه‌ای کار می‌کند که به این قابلیت نیاز دارد یا کاربری که به دنبال دسترسی بیشتر به سند PDF است، درک نحوه تبدیل PDF به HTML در Java ضروری است. در این پست وبلاگ، شما را با فرآیند تبدیل اسناد PDF به HTML با استفاده از Java آشنا خواهیم کرد.

تبدیل PDF به HTML در CSharp.

توسعه دهندگان جاوا: API تبدیل PDF به HTML

GroupDocs API تبدیل سند و تصویر را برای توسعه دهندگان Java به نمایش می گذارد. از لیست بزرگی از فرمت های سند و تصویر برای تبدیل از یک فرمت به فرمت دیگر پشتیبانی می کند. علاوه بر این، نتایج تبدیل را نیز می توان با استفاده از گزینه های پیشرفته موجود سفارشی کرد. من از GroupDocs.Conversion for Java API آن برای تبدیل یک سند PDF به فرمت HTML استفاده خواهم کرد.

دانلود یا پیکربندی کنید

می‌توانید فایل JAR را از بخش دانلودها دانلود کنید، یا فقط تنظیمات مخزن و وابستگی را برای pom.xml برنامه‌های Java مبتنی بر maven خود دریافت کنید.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

نحوه تبدیل PDF به HTML با استفاده از جاوا

تبدیل PDF به HTML با استفاده از Java یک فرآیند ساده است. مراحل زیر شما را در فرآیند تبدیل تمام صفحات یک فایل PDF به فرمت HTML راهنمایی می کند.

  • از کلاس Converter برای بارگیری فایل PDF استفاده کنید.
  • از روش Convert برای تبدیل سند بارگذاری شده به فرمت HTML استفاده کنید.

کد زیر نحوه تبدیل کل یک سند PDF را با استفاده از Java به HTML نشان می دهد.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// تبدیل PDF به HTML در جاوا
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

تبدیل صفحات خاص یک PDF امن در جاوا

تبدیل اسناد PDF محافظت شده یا قفل شده نیز امکان پذیر است. مراحل زیر شما را در فرآیند تبدیل صفحات خاص یک سند PDF قفل شده به فرمت HTML با استفاده از Java راهنمایی می کند.

  • از کلاس PdfLoadOptions برای آماده سازی گزینه های بارگیری استفاده کنید.
  • فایل PDF را با استفاده از کلاس Converter بارگیری کنید.
  • از کلاس WebConvertOptions برای آماده سازی گزینه های تبدیل برای قالب HTML استفاده کنید.
  • با تنظیم ویژگی هایی مانند Pages، Page Number، PageCount، Zoom و غیره، صفحات خاصی را که باید تبدیل شوند، تعریف کنید.
  • در نهایت از روش Convert برای تبدیل فایل PDF بارگذاری شده به فرمت HTML استفاده کنید.

کد Java زیر نحوه تبدیل صفحات انتخابی یک سند PDF محافظت شده با رمز عبور را به HTML نشان می دهد.

// صفحات انتخاب شده PDF محافظت شده با رمز عبور را به HTML در Java تبدیل کنید

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

نتیجه

به طور خلاصه، این مقاله به مبحث تبدیل اسناد PDF به HTML در Java پرداخته است. ما از طریق دو رویکرد مختلف، از جمله تبدیل کل سند با گزینه های پیش فرض و تبدیل صفحات خاصی از یک سند محافظت شده با رمز عبور، قدم برداشتیم.

برای کسب اطلاعات بیشتر در مورد Java Conversion Automation API، به مستندات، مرجع API مراجعه کنید، یا نمونه‌های GitHub را بررسی کنید. اگر سؤال دیگری دارید، از طریق [فروم 5 با ما در میان بگذارید.

همچنین ببینید