W przypadku danych w formie tabelarycznej dokumentów PDF i Word czasami trzeba przekonwertować je na arkusze kalkulacyjne Excel. Musimy zautomatyzować tę konwersję jak największej liczby dokumentów do arkuszy kalkulacyjnych lub wielu skoroszytów. W tym artykule omówiono, jak programowo konwertować dokumenty Word do Excela, a także jak konwertować pliki PDF do arkuszy kalkulacyjnych Excel w Javie.
Poniżej omówiono pokrótce następujące tematy:
- Java API — konwersja dokumentów do arkuszy kalkulacyjnych
- Konwertuj plik PDF na arkusz kalkulacyjny Excel
- Konwersja programu Word do arkusza kalkulacyjnego Excel
- Konwersja plików PDF lub Word na arkusz kalkulacyjny z większą liczbą opcji
Java API do konwersji do arkusza kalkulacyjnego
GroupDocs.Conversion for Java to interfejs API, który umożliwia konwertowanie dokumentów PDF i Word na arkusze kalkulacyjne w aplikacjach Java. API umożliwia konwersję dokumentów i obrazów w wielu formatach plików. Niektóre z obsługiwanych formatów dokumentów obejmują dokumenty edytorów tekstu, arkusze kalkulacyjne, prezentacje, eBooki, formaty AutoCAD, PDF, wiadomości e-mail, strony internetowe, obrazy.
Pobierz i skonfiguruj
Możesz pobrać bibliotekę konwersji z sekcji pobierania lub dodać następującą konfigurację pom.xml w swojej aplikacji Java opartej na Maven. Następnie możesz wypróbować przykłady z tego artykułu, a także wiele innych przykładów dostępnych na GitHub. Aby uzyskać szczegółowe informacje, odwiedź Odniesienie do interfejsu API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
Konwertuj pliki PDF na Excel w Javie
Aby przekonwertować dowolny dokument PDF na arkusz kalkulacyjny Excel, można wykonać następujące kroki.
- Załaduj plik PDF za pomocą klasy Converter.
- Przygotuj opcje konwersji za pomocą SpreadsheetConvertOptions.
- Wywołaj metodę convert z utworzonymi opcjami.
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na arkusz kalkulacyjny Excel XLSX w Javie.
// Konwertuj dokument PDF na arkusz kalkulacyjny Excel w Javie
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
Konwertuj Worda na Excela w Javie
Podobnie każdy dokument programu Word można przekonwertować na arkusz kalkulacyjny programu Excel w taki sam sposób, w jaki właśnie przekonwertowaliśmy dokument PDF. Podaj odpowiedni plik źródłowy i skonwertuj go do formatu XLS lub XLSX.
Poniżej przedstawiono krok konwersji dowolnego pliku DOC DOCX na arkusz kalkulacyjny Excel.
- Załaduj plik DOC, DOCX, używając klasy Converter.
- Przygotuj opcje konwersji za pomocą SpreadsheetConvertOptions.
- Wywołaj metodę convert klasy Converter z opcjami.
Poniższy kod źródłowy pokazuje, jak przekonwertować plik DOC lub DOCX do formatu Excel XLSX w Javie.
// Konwertuj dokument programu Word na arkusz kalkulacyjny Excel w Javie
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
Konwersja PDF lub Word na arkusz kalkulacyjny z większą liczbą opcji przy użyciu języka Java
Nie musisz konwertować całego dokumentu za każdym razem. Możesz konwertować tylko wybrane strony dokumentu. Interfejs API umożliwia konwersję dokumentu za pomocą różnych opcji, które obejmują:
- Numer strony początkowej.
- Liczba stron.
- Określone strony do konwersji.
- Format do przekonwertowania.
- Hasło do ochrony pliku.
- Powiększ, aby powiększyć lub pomniejszyć.
- Znak wodny w pliku konwertera.
Poniżej przedstawiono kroki konwersji niektórych stron pliku PDF do formatu XLSX z różnym powiększeniem w Javie.
// Konwertuj drugą stronę pliku PDF na Excel w Javie z pewnymi opcjami
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
Plik PDF i przekonwertowany arkusz kalkulacyjny jako dane wyjściowe są pokazane tutaj. Konwertował drugą stronę pliku PDF na format XLSX.
Uzyskaj bezpłatną licencję API
Możesz uzyskać bezpłatną tymczasową licencję, aby korzystać z API bez ograniczeń ewaluacyjnych.
Wniosek
W tym artykule omówiliśmy konwersję dokumentów PDF i Word do arkusza kalkulacyjnego Excel w Javie. Ponadto nauczyliśmy się, jak konwertować dowolną część dokumentu za pomocą opcji takich jak znak wodny, powiększanie i chronić go za pomocą ochrony hasłem.
Więcej opcji i przykładów znajdziesz w repozytorium documentation i GitHub. W przypadku pytań skontaktuj się z nami za pośrednictwem forum.