Voor de gegevens in tabelvorm van uw PDF- en Word-documenten moet u deze soms converteren naar Excel-spreadsheets. We moeten deze conversie van zoveel mogelijk documenten naar spreadsheets of meerdere werkmappen automatiseren. In dit artikel wordt besproken hoe u Word-documenten programmatisch naar Excel converteert en ook hoe u PDF-bestanden converteert naar Excel-spreadsheets in Java.

Converteer Word en PDF naar Excel in Java

De volgende onderwerpen worden hier kort besproken:

Java API voor conversie naar spreadsheet

GroupDocs.Conversion for Java is de API waarmee u PDF- en Word-documenten kunt converteren naar spreadsheets binnen uw Java-toepassingen. De API maakt conversies van documenten en afbeeldingen in vele bestandsindelingen mogelijk. Enkele van de ondersteunde documentformaten zijn tekstverwerkingsdocumenten, spreadsheets, presentaties, eBooks, AutoCAD-formaten, PDF, e-mailberichten, webpagina’s, afbeeldingen.

Downloaden en configureren

U kunt de conversiebibliotheek ophalen uit de downloadsectie of de volgende pom.xml-configuratie toevoegen aan uw op Maven gebaseerde Java-toepassing. Daarna kun je voorbeelden van dit artikel proberen, evenals nog veel meer voorbeelden die beschikbaar zijn op GitHub. Voor meer informatie kunt u de API-referentie bezoeken.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

Converteer PDF naar Excel in Java

De volgende stappen kunnen worden gevolgd om elk PDF-document naar een Excel-spreadsheet te converteren.

Het volgende codevoorbeeld laat zien hoe u een PDF-bestand converteert naar een Excel XLSX-spreadsheet in Java.

// Converteer PDF-document naar Excel-spreadsheet in Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

Converteer Word naar Excel in Java

Op dezelfde manier kan elk Word-document worden geconverteerd naar een Excel-spreadsheet op dezelfde manier als we zojuist het PDF-document hebben geconverteerd. Zorg voor het juiste bronbestand en laat het converteren naar XLS of XLSX.

Hieronder volgen de stappen om elk DOC DOCX-bestand naar een Excel-spreadsheet te converteren.

  • Laad het DOC-, DOCX-bestand met behulp van de Converter-klasse.
  • Bereid de conversieopties voor met behulp van SpreadsheetConvertOptions.
  • Roep de methode convert van de klasse Converter aan met opties.

De volgende broncode laat zien hoe u een DOC- of DOCX-bestand converteert naar Excel XLSX-indeling in Java.

// Converteer Word-document naar Excel-spreadsheet in Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

Conversie van PDF of Word naar Spreadsheet met meer opties met behulp van Java

U bent niet verplicht om elke keer het hele document te laten converteren. U kunt alleen de geselecteerde pagina’s van uw document converteren. De API geeft u het voorrecht om het document te converteren met verschillende opties, waaronder:

  • Beginpaginanummer.
  • Aantal pagina’s.
  • Specifieke pagina’s voor conversie.
  • Formaat om naar te converteren.
  • Wachtwoord om het bestand te beveiligen.
  • Zoom in om het groter of kleiner te maken.
  • Watermerk op het converterbestand.

Hieronder volgen de stappen voor het converteren van enkele pagina’s van een PDF-bestand naar XLSX-indeling met verschillende zoomfuncties in Java.

// Converteer de tweede pagina van een PDF-bestand naar Excel in Java met enkele opties
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

Het PDF-bestand en de geconverteerde spreadsheet als uitvoer worden hier getoond. Het converteerde de tweede pagina van het PDF-bestand naar XLSX-indeling.

Converteer PDF programmatisch naar Excel XLS XLSX

Ontvang een gratis API-licentie

U kunt een gratis tijdelijke licentie krijgen om de API zonder evaluatiebeperkingen te gebruiken.

Conclusie

In dit artikel hebben we de conversie van PDF- en Word-documenten naar een Excel-spreadsheet in Java besproken. Bovendien hebben we geleerd hoe we elk deel van het document kunnen converteren met opties zoals watermerk, zoomen en het kunnen beveiligen met wachtwoordbeveiliging.

Ga voor meer opties en voorbeelden naar de documentatie en de GitHub-repository. Voor vragen kunt u ons bereiken via het forum.

Zie ook