Para os dados em forma de tabela de seus documentos PDF e Word, às vezes você precisa convertê-los em planilhas do Excel. Precisamos automatizar essa conversão de tantos documentos para planilhas ou várias pastas de trabalho. Este artigo discutirá como converter programaticamente documentos do Word em Excel e também como converter arquivos PDF em planilhas do Excel em Java.

Converter Word e PDF para Excel em Java

Os seguintes tópicos são discutidos brevemente aqui:

API Java para conversão em planilha

GroupDocs.Conversion for Java é a API que permite converter documentos PDF e Word em planilhas em seus aplicativos Java. A API permite conversões de documentos e imagens em vários formatos de arquivo. Alguns dos formatos de documentos suportados incluem documentos de processamento de texto, planilhas, apresentações, eBooks, formatos AutoCAD, PDF, mensagens de e-mail, páginas da Web, imagens.

Baixe e configure

Você pode obter a biblioteca de conversão na seção de downloads ou adicionar a seguinte configuração pom.xml em seu aplicativo Java baseado em Maven. Depois, você pode tentar exemplos deste artigo, bem como muitos outros exemplos disponíveis no GitHub. Para obter detalhes, você pode visitar a Referência da API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

Converter PDF para Excel em Java

As etapas a seguir podem ser seguidas para converter qualquer documento PDF em uma planilha do Excel.

O exemplo de código a seguir mostra como converter um arquivo PDF em uma planilha Excel XLSX em Java.

// Converter documento PDF para planilha do Excel em Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

Converter Word para Excel em Java

Da mesma forma, qualquer documento do Word pode ser convertido em uma planilha do Excel da mesma maneira que acabamos de converter o documento PDF. Forneça o arquivo de origem correto e converta-o em XLS ou XLSX.

A seguir estão as etapas para converter qualquer arquivo DOC DOCX em uma planilha do Excel.

  • Carregue o arquivo DOC, DOCX usando a classe Converter.
  • Prepare as opções de conversão usando SpreadsheetConvertOptions.
  • Chame o método convert da classe Converter com opções.

O código-fonte a seguir mostra como converter um arquivo DOC ou DOCX no formato Excel XLSX em Java.

// Converter documento do Word para planilha do Excel em Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

Conversão de PDF ou Word para Planilha com mais opções usando Java

Você não é obrigado a converter todo o documento todas as vezes. Você pode converter apenas as páginas selecionadas do seu documento. A API dá a você o privilégio de converter o documento com várias opções que incluem:

  • Começando Número da página.
  • Contagem de páginas.
  • Páginas específicas para conversão.
  • Formato para converter.
  • Senha para tornar o arquivo protegido.
  • Zoom para aumentar ou diminuir.
  • Marca d’água no arquivo do conversor.

A seguir estão as etapas de como converter algumas das páginas de um arquivo PDF em formato XLSX com zoom diferente em Java.

// Converta a segunda página do arquivo PDF para Excel em Java com algumas opções
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

O arquivo PDF e a planilha convertida como saída são mostrados aqui. Ele converteu a segunda página do arquivo PDF em formato XLSX.

Converter PDF para Excel XLS XLSX Programaticamente

Obtenha uma licença de API gratuita

Você pode obter uma licença temporária gratuita para usar a API sem limitações de avaliação.

Conclusão

Neste artigo, discutimos a conversão de documentos PDF e Word para uma planilha do Excel em Java. Além disso, aprendemos como converter qualquer parte do documento com opções como marca d’água, zoom e protegê-lo usando proteção por senha.

Para mais opções e exemplos, visite a documentação e o repositório GitHub. Para dúvidas, entre em contato conosco pelo fórum.

Veja também