Đối với dữ liệu ở dạng bảng của tài liệu PDF và Word, đôi khi bạn cần chuyển đổi dữ liệu đó sang bảng tính Excel. Chúng tôi cần tự động hóa quá trình chuyển đổi nhiều tài liệu này thành bảng tính hoặc nhiều sổ làm việc. Bài viết này sẽ thảo luận về cách lập trình chuyển đổi tài liệu Word sang Excel và cả cách chuyển đổi tệp PDF sang bảng tính Excel trong Java.
Các chủ đề sau đây được thảo luận ngắn gọn ở đây:
- API Java - Chuyển đổi tài liệu sang bảng tính
- Chuyển đổi bảng tính PDF sang Excel
- Chuyển bảng tính Word sang Excel
- Chuyển đổi PDF hoặc Word sang Bảng tính với nhiều tùy chọn hơn
API Java để chuyển đổi sang bảng tính
GroupDocs.Conversion for Java là API cho phép bạn chuyển đổi tài liệu PDF và Word thành bảng tính trong các ứng dụng Java của mình. API cho phép chuyển đổi tài liệu và hình ảnh ở nhiều định dạng tệp. Một số định dạng tài liệu được hỗ trợ bao gồm tài liệu soạn thảo văn bản, bảng tính, bản trình bày, sách điện tử, định dạng AutoCAD, PDF, thư điện tử, trang Web, hình ảnh.
Tải xuống và định cấu hình
Bạn có thể lấy thư viện chuyển đổi từ phần tải xuống hoặc thêm cấu hình pom.xml sau vào ứng dụng Java dựa trên Maven của mình. Sau đó, bạn có thể thử các ví dụ của bài viết này cũng như nhiều ví dụ khác có sẵn trên GitHub. Để biết chi tiết, bạn có thể truy cập Tham khảo API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
Chuyển đổi PDF sang Excel trong Java
Có thể làm theo các bước sau để chuyển đổi bất kỳ tài liệu PDF nào sang bảng tính Excel.
- Tải tệp PDF bằng lớp Converter.
- Chuẩn bị các tùy chọn chuyển đổi bằng cách sử dụng SpreadsheetConvertOptions.
- Gọi phương thức convert với các tùy chọn đã tạo.
Mẫu mã sau đây cho biết cách chuyển đổi tệp PDF thành bảng tính Excel XLSX trong Java.
// Chuyển đổi tài liệu PDF sang Bảng tính Excel trong Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
Chuyển đổi Word sang Excel trong Java
Tương tự, bất kỳ tài liệu Word nào cũng có thể được chuyển đổi thành bảng tính Excel giống như cách chúng tôi vừa chuyển đổi tài liệu PDF. Cung cấp tệp nguồn phù hợp và chuyển đổi nó thành XLS hoặc XLSX.
Sau đây là các bước để chuyển đổi bất kỳ tệp DOC DOCX nào sang bảng tính Excel.
- Tải tệp DOC, DOCX bằng lớp Trình chuyển đổi.
- Chuẩn bị các tùy chọn chuyển đổi bằng SpreadsheetConvertOptions.
- Gọi phương thức chuyển đổi của lớp Trình chuyển đổi với các tùy chọn.
Mã nguồn sau đây cho biết cách chuyển đổi tệp DOC hoặc DOCX sang định dạng Excel XLSX trong Java.
// Chuyển đổi tài liệu Word sang Bảng tính Excel trong Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
Chuyển đổi PDF hoặc Word sang bảng tính với nhiều tùy chọn hơn bằng Java
Bạn không nhất thiết phải chuyển đổi toàn bộ tài liệu mỗi lần. Bạn chỉ có thể chuyển đổi các trang đã chọn trong tài liệu của mình. API cung cấp cho bạn đặc quyền chuyển đổi tài liệu với nhiều tùy chọn khác nhau bao gồm:
- Số trang bắt đầu.
- Đếm trang.
- Các trang cụ thể để chuyển đổi.
- Định dạng để chuyển đổi thành.
- Mật khẩu để bảo vệ tập tin.
- Thu phóng để làm cho nó lớn hơn hoặc nhỏ hơn.
- Hình mờ trên tập tin chuyển đổi.
Sau đây là các bước để chuyển đổi một số trang của tệp PDF sang định dạng XLSX với các mức thu phóng khác nhau trong Java.
// Chuyển đổi trang thứ hai của tệp PDF sang Excel trong Java với một số tùy chọn
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
Tệp PDF và bảng tính đã chuyển đổi dưới dạng đầu ra được hiển thị ở đây. Nó đã chuyển đổi trang thứ hai của tệp PDF sang định dạng XLSX.
Nhận giấy phép API miễn phí
Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng API mà không bị giới hạn đánh giá.
Sự kết luận
Trong bài viết này, chúng tôi đã thảo luận về việc chuyển đổi tài liệu PDF và Word thành bảng tính Excel trong Java. Ngoài ra, chúng tôi đã học cách chuyển đổi bất kỳ phần nào của tài liệu với các tùy chọn như hình mờ, thu phóng và bảo vệ tài liệu bằng mật khẩu bảo vệ.
Để biết thêm tùy chọn và ví dụ, hãy truy cập kho lưu trữ tài liệu và GitHub. Đối với các truy vấn, hãy liên hệ với chúng tôi qua diễn đàn.