ในยุคดิจิทัลปัจจุบัน ความสามารถในการแปลงเอกสาร PDF เป็นรูปแบบ HTML มีความสำคัญมากขึ้นเรื่อยๆ ไม่ว่าคุณจะเป็นนักพัฒนาที่ทำงานในโครงการที่ต้องใช้ฟังก์ชันนี้หรือผู้ใช้ที่ต้องการทำให้เอกสาร PDF สามารถเข้าถึงได้มากขึ้น การทำความเข้าใจวิธีแปลง PDF เป็น HTML ใน Java เป็นสิ่งสำคัญ ในบล็อกโพสต์นี้ เราจะแนะนำคุณเกี่ยวกับกระบวนการแปลงเอกสาร PDF เป็น HTML โดยใช้ Java

แปลง PDF เป็น HTML ใน CSharp

นักพัฒนา Java: API การแปลง PDF เป็น HTML

GroupDocs แสดง API การแปลงเอกสารและรูปภาพสำหรับนักพัฒนา Java รองรับรายการรูปแบบเอกสารและรูปภาพจำนวนมากสำหรับการแปลงจากรูปแบบหนึ่งเป็นอีกรูปแบบหนึ่ง นอกจากนี้ยังสามารถปรับแต่งผลลัพธ์ของการแปลงได้โดยใช้ตัวเลือกขั้นสูงที่มีอยู่ ฉันจะใช้ GroupDocs.Conversion for Java API เพื่อแปลงเอกสาร PDF เป็นรูปแบบ HTML

ดาวน์โหลดหรือกำหนดค่า

คุณสามารถดาวน์โหลดไฟล์ JAR ได้จาก ส่วนการดาวน์โหลด หรือเพียงแค่รับการกำหนดค่าพื้นที่เก็บข้อมูลและการพึ่งพาสำหรับ pom.xml ของแอปพลิเคชัน Java ที่ใช้ maven

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

วิธีแปลง PDF เป็น HTML โดยใช้ Java

การแปลง PDF เป็น HTML โดยใช้ Java เป็นกระบวนการที่ไม่ซับซ้อน ขั้นตอนต่อไปนี้จะแนะนำคุณตลอดกระบวนการแปลงหน้าทั้งหมดของไฟล์ PDF เป็นรูปแบบ HTML

  • ใช้คลาส Converter เพื่อโหลดไฟล์ PDF
  • ใช้เมธอด Convert เพื่อแปลงเอกสารที่โหลดเป็นรูปแบบ HTML

รหัสต่อไปนี้สาธิตวิธีการแปลงเอกสาร PDF ทั้งหมดเป็น HTML โดยใช้ Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// แปลง PDF เป็น HTML ใน Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

การแปลงหน้าเฉพาะของ PDF ที่ปลอดภัยใน Java

นอกจากนี้ยังสามารถแปลงเอกสาร PDF ที่มีการป้องกันหรือล็อกได้อีกด้วย ขั้นตอนต่อไปนี้จะแนะนำคุณตลอดกระบวนการแปลงหน้าเฉพาะของเอกสาร PDF ที่ถูกล็อกเป็นรูปแบบ HTML โดยใช้ Java

  • ใช้คลาส PdfLoadOptions เพื่อเตรียมตัวเลือกการโหลด
  • โหลดไฟล์ PDF โดยใช้คลาส Converter
  • ใช้คลาส WebConvertOptions เพื่อเตรียมตัวเลือกการแปลงสำหรับรูปแบบ HTML
  • กำหนดหน้าเฉพาะที่จะแปลงโดยการตั้งค่าคุณสมบัติเช่น Pages, PageNumber, PageCount, Zoom เป็นต้น
  • สุดท้าย ใช้เมธอด Convert เพื่อแปลงไฟล์ PDF ที่โหลดเป็นรูปแบบ HTML

โค้ด Java ต่อไปนี้สาธิตวิธีแปลงหน้าที่เลือกของเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML

// แปลงหน้าที่เลือกของ PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML ใน Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

บทสรุป

โดยสรุป บทความนี้กล่าวถึงหัวข้อการแปลงเอกสาร PDF เป็น HTML ใน Java เราแนะนำสองวิธีที่แตกต่างกัน ได้แก่ การแปลงเอกสารทั้งฉบับด้วยตัวเลือกเริ่มต้น และการแปลงหน้าเฉพาะของเอกสารที่ป้องกันด้วยรหัสผ่าน

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Java Conversion Automation API โปรดดูที่ เอกสารประกอบ, ข้อมูลอ้างอิง API หรือดูที่ ตัวอย่าง GitHub หากคุณมีคำถามเพิ่มเติม โปรดติดต่อเราผ่าน ฟอรัม

ดูสิ่งนี้ด้วย