Für die tabellarischen Daten Ihrer PDF- und Word-Dokumente müssen Sie diese manchmal in Excel-Tabellen umwandeln. Wir müssen diese Konvertierung von möglichst vielen Dokumenten in Tabellenkalkulationen oder mehrere Arbeitsmappen automatisieren. In diesem Artikel wird erläutert, wie Sie Word-Dokumente programmgesteuert in Excel konvertieren und wie Sie PDF-Dateien in Excel-Tabellen in Java konvertieren.

Konvertieren Sie Word und PDF in Java in Excel

Folgende Themen werden hier kurz besprochen:

Java-API für die Konvertierung in Tabellenkalkulation

GroupDocs.Conversion for Java ist die API, mit der Sie PDF- und Word-Dokumente in Tabellenkalkulationen innerhalb Ihrer Java-Anwendungen konvertieren können. Die API ermöglicht die Konvertierung von Dokumenten und Bildern in viele Dateiformate. Zu den unterstützten Dokumentformaten gehören Textverarbeitungsdokumente, Tabellenkalkulationen, Präsentationen, eBooks, AutoCAD-Formate, PDF, E-Mail-Nachrichten, Webseiten und Bilder.

Herunterladen und konfigurieren

Sie können die Konvertierungsbibliothek aus dem Download-Bereich herunterladen oder die folgende pom.xml-Konfiguration in Ihrer Maven-basierten Java-Anwendung hinzufügen. Anschließend können Sie Beispiele dieses Artikels sowie viele weitere Beispiele ausprobieren, die auf GitHub verfügbar sind. Einzelheiten finden Sie in der API-Referenz.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

Konvertieren Sie PDF in Excel in Java

Die folgenden Schritte können befolgt werden, um jedes PDF-Dokument in eine Excel-Tabelle zu konvertieren.

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei in eine Excel-XLSX-Tabelle in Java konvertieren.

// Konvertieren Sie ein PDF-Dokument in eine Excel-Tabelle in Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

Konvertieren Sie Word in Java in Excel

Ebenso kann jedes Word-Dokument auf die gleiche Weise in eine Excel-Tabelle konvertiert werden, wie wir gerade das PDF-Dokument konvertiert haben. Stellen Sie die richtige Quelldatei bereit und lassen Sie sie in XLS oder XLSX konvertieren.

Im Folgenden sind die Schritte zum Konvertieren einer beliebigen DOC-DOCX-Datei in eine Excel-Tabelle aufgeführt.

  • Laden Sie die DOC-, DOCX-Datei mit der Converter-Klasse.
  • Bereiten Sie die Konvertierungsoptionen mit SpreadsheetConvertOptions vor.
  • Rufen Sie die convert-Methode der Converter-Klasse mit Optionen auf.

Der folgende Quellcode zeigt, wie Sie eine DOC- oder DOCX-Datei in das Excel-XLSX-Format in Java konvertieren.

// Konvertieren Sie ein Word-Dokument in eine Excel-Tabelle in Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

PDF- oder Word-zu-Tabellen-Konvertierung mit mehr Optionen unter Verwendung von Java

Sie müssen nicht jedes Mal das gesamte Dokument konvertieren lassen. Sie können nur die ausgewählten Seiten Ihres Dokuments konvertieren. Die API gibt Ihnen das Recht, das Dokument mit verschiedenen Optionen zu konvertieren, darunter:

  • Beginnende Seitenzahl.
  • Seitenzahl.
  • Spezielle Seiten für die Konvertierung.
  • Format zum Konvertieren.
  • Passwort, um die Datei zu schützen.
  • Zoomen, um es zu vergrößern oder zu verkleinern.
  • Wasserzeichen in der Konverterdatei.

Im Folgenden finden Sie die Schritte zum Konvertieren einiger Seiten einer PDF-Datei in das XLSX-Format mit unterschiedlichem Zoom in Java.

// Konvertieren Sie die zweite Seite der PDF-Datei in Java mit einigen Optionen in Excel
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

Hier werden die PDF-Datei und die konvertierte Tabelle als Ausgabe angezeigt. Es konvertierte die zweite Seite der PDF-Datei in das XLSX-Format.

Konvertieren Sie PDF programmgesteuert in Excel XLS XLSX

Holen Sie sich eine kostenlose API-Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben wir die Konvertierung von PDF- und Word-Dokumenten in eine Excel-Tabelle in Java besprochen. Außerdem haben wir gelernt, wie man einen beliebigen Teil des Dokuments mit Optionen wie Wasserzeichen, Zoom und Passwortschutz umwandelt.

Weitere Optionen und Beispiele finden Sie in der Dokumentation und im GitHub-Repository. Bei Fragen erreichen Sie uns über das Forum.

Siehe auch