สำหรับข้อมูลในรูปแบบตารางของเอกสาร PDF และ Word บางครั้งคุณจำเป็นต้องแปลงเป็นสเปรดชีต Excel เราจำเป็นต้องแปลงเอกสารจำนวนมากเป็นสเปรดชีตหรือสมุดงานหลายชุดโดยอัตโนมัติ บทความนี้จะกล่าวถึงวิธีการแปลงเอกสาร Word เป็น Excel โดยทางโปรแกรมและวิธีแปลงไฟล์ PDF เป็นสเปรดชีต Excel ใน Java

แปลง Word และ PDF เป็น Excel ใน Java

หัวข้อต่อไปนี้จะกล่าวถึงโดยสังเขปที่นี่:

Java API สำหรับการแปลงเป็นสเปรดชีต

GroupDocs.Conversion for Java เป็น API ที่ให้คุณแปลงเอกสาร PDF และ Word เป็นสเปรดชีตภายในแอปพลิเคชัน Java ของคุณ API ช่วยให้การแปลงเอกสารและรูปภาพเป็นไฟล์ได้หลายรูปแบบ รูปแบบเอกสารที่รองรับบางรูปแบบ ได้แก่ เอกสารประมวลผลคำ สเปรดชีต งานนำเสนอ eBook รูปแบบ AutoCAD PDF ข้อความอีเมล เว็บเพจ รูปภาพ

ดาวน์โหลดและกำหนดค่า

คุณสามารถรับไลบรารีการแปลงได้จากส่วนการดาวน์โหลดหรือเพิ่มการกำหนดค่า pom.xml ต่อไปนี้ในแอปพลิเคชัน Java ที่ใช้ Maven หลังจากนั้น คุณสามารถลองใช้ตัวอย่างของบทความนี้รวมถึงตัวอย่างอื่นๆ อีกมากมายที่มีอยู่บน GitHub สำหรับรายละเอียด คุณสามารถไปที่ ข้อมูลอ้างอิง API

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

แปลง PDF เป็น Excel ใน Java

สามารถทำตามขั้นตอนต่อไปนี้เพื่อแปลงเอกสาร PDF เป็นสเปรดชีต Excel

  • โหลดไฟล์ PDF โดยใช้คลาส Converter
  • เตรียมตัวเลือกการแปลงโดยใช้ SpreadsheetConvertOptions
  • เรียกใช้เมธอด convert ด้วยตัวเลือกที่สร้างขึ้น

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงไฟล์ PDF เป็นสเปรดชีต Excel XLSX ใน Java

// แปลงเอกสาร PDF เป็นสเปรดชีต Excel ใน Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

แปลง Word เป็น Excel ใน Java

ในทำนองเดียวกัน เอกสาร Word ใดๆ ก็สามารถแปลงเป็นสเปรดชีต Excel ได้ในลักษณะเดียวกับที่เราเพิ่งแปลงเอกสาร PDF ระบุไฟล์ต้นฉบับที่ถูกต้องและแปลงเป็น XLS หรือ XLSX

ต่อไปนี้เป็นขั้นตอนในการแปลงไฟล์ DOC DOCX เป็นสเปรดชีต Excel

  • โหลดไฟล์ DOC, DOCX โดยใช้คลาส Converter
  • เตรียมตัวเลือกการแปลงโดยใช้ SpreadsheetConvertOptions
  • เรียกใช้เมธอดการแปลงของคลาส Converter พร้อมตัวเลือก

ซอร์สโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ DOC หรือ DOCX เป็นรูปแบบ Excel XLSX ใน Java

// แปลงเอกสาร Word เป็นสเปรดชีต Excel ใน Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

การแปลง PDF หรือ Word เป็นสเปรดชีตพร้อมตัวเลือกเพิ่มเติมโดยใช้ Java

คุณไม่จำเป็นต้องแปลงเอกสารทั้งหมดทุกครั้ง คุณสามารถแปลงเฉพาะหน้าที่เลือกในเอกสารของคุณ API ให้สิทธิ์คุณในการแปลงเอกสารด้วยตัวเลือกต่างๆ ซึ่งรวมถึง:

  • หมายเลขหน้าเริ่มต้น.
  • จำนวนหน้า
  • หน้าเฉพาะสำหรับการแปลง
  • รูปแบบที่จะแปลงเป็น.
  • รหัสผ่านสำหรับป้องกันไฟล์
  • ซูมเพื่อทำให้ใหญ่ขึ้นหรือเล็กลง
  • ลายน้ำบนไฟล์ตัวแปลง

ต่อไปนี้เป็นขั้นตอนในการแปลงบางหน้าของไฟล์ PDF เป็นรูปแบบ XLSX ด้วยการซูมที่แตกต่างกันใน Java

// แปลงหน้าที่สองของไฟล์ PDF เป็น Excel ใน Java ด้วยตัวเลือกบางอย่าง
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

ไฟล์ PDF และสเปรดชีตที่แปลงเป็นเอาต์พุตจะแสดงที่นี่ มันแปลงหน้าที่สองของไฟล์ PDF เป็นรูปแบบ XLSX

แปลง PDF เป็น Excel XLS XLSX โดยทางโปรแกรม

รับใบอนุญาต API ฟรี

คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อใช้ API โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ เราได้กล่าวถึงการแปลงเอกสาร PDF และ Word เป็นสเปรดชีต Excel ใน Java นอกจากนี้ เราได้เรียนรู้วิธีแปลงส่วนใดๆ ของเอกสารด้วยตัวเลือกต่างๆ เช่น ลายน้ำ การซูม และทำให้ส่วนนั้นได้รับการปกป้องโดยใช้การป้องกันด้วยรหัสผ่าน

สำหรับตัวเลือกและตัวอย่างเพิ่มเติม โปรดไปที่ เอกสารประกอบ และที่เก็บ GitHub สำหรับข้อสงสัย ติดต่อเราผ่านทาง ฟอรัม

ดูสิ่งนี้ด้วย