Para los datos en formato tabular de sus documentos PDF y Word, a veces necesita convertirlos a hojas de cálculo de Excel. Necesitamos automatizar esta conversión de tantos documentos a hojas de cálculo o varios libros de trabajo. Este artículo discutirá cómo convertir documentos de Word a Excel mediante programación y también cómo convertir archivos PDF a hojas de cálculo de Excel en Java.
Aquí se tratan brevemente los siguientes temas:
- API de Java - Conversión de documentos a hojas de cálculo
- Convertir PDF a hoja de cálculo de Excel
- Convertir hoja de cálculo de Word a Excel
- Conversión de PDF o Word a hoja de cálculo con más opciones
API de Java para conversión a hoja de cálculo
GroupDocs.Conversion for Java es la API que le permite convertir documentos PDF y Word en hojas de cálculo dentro de sus aplicaciones Java. La API permite conversiones de documentos e imágenes en muchos formatos de archivo. Algunos de los formatos de documentos admitidos incluyen documentos de procesamiento de textos, hojas de cálculo, presentaciones, libros electrónicos, formatos de AutoCAD, PDF, mensajes de correo electrónico, páginas web e imágenes.
Descargar y configurar
Puede obtener la biblioteca de conversión desde la sección de descargas o agregar la siguiente configuración pom.xml en su aplicación Java basada en Maven. Luego, puede probar ejemplos de este artículo, así como muchos más ejemplos disponibles en GitHub. Para obtener más información, puede visitar la Referencia API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
Convertir PDF a Excel en Java
Se pueden seguir los siguientes pasos para convertir cualquier documento PDF a una hoja de cálculo de Excel.
- Cargue el archivo PDF usando la clase Converter.
- Preparar opciones de conversión usando SpreadsheetConvertOptions.
- Llame al método convertir con las opciones creadas.
El siguiente ejemplo de código muestra cómo convertir un archivo PDF en una hoja de cálculo Excel XLSX en Java.
// Convierta un documento PDF a una hoja de cálculo de Excel en Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
Convertir Word a Excel en Java
De manera similar, cualquier documento de Word se puede convertir a una hoja de cálculo de Excel de la misma manera que acabamos de convertir el documento PDF. Proporcione el archivo fuente correcto y conviértalo a XLS o XLSX.
Los siguientes son los pasos para convertir cualquier archivo DOC DOCX a una hoja de cálculo de Excel.
- Cargue el archivo DOC, DOCX usando la clase Converter.
- Prepare las opciones de conversión usando SpreadsheetConvertOptions.
- Llame al método convert de la clase Converter con opciones.
El siguiente código fuente muestra cómo convertir un archivo DOC o DOCX al formato Excel XLSX en Java.
// Convierta un documento de Word a una hoja de cálculo de Excel en Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
Conversión de PDF o Word a hoja de cálculo con más opciones usando Java
No está obligado a convertir todo el documento cada vez. Puede convertir solo las páginas seleccionadas de su documento. La API le otorga el privilegio de convertir el documento con varias opciones que incluyen:
- Iniciando Número de página.
- Recuento de páginas.
- Páginas específicas para conversión.
- Formato al que convertir.
- Contraseña para proteger el archivo.
- Zoom para hacerlo más grande o más pequeño.
- Marca de agua en el archivo del convertidor.
Los siguientes son los pasos para convertir algunas de las páginas de un archivo PDF en formato XLSX con diferente zoom en Java.
// Convierta la segunda página del archivo PDF a Excel en Java con algunas opciones
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
El archivo PDF y la hoja de cálculo convertida como salida se muestran aquí. Convirtió la segunda página del archivo PDF en formato XLSX.
Obtenga una licencia de API gratuita
Puede obtener una licencia temporal gratuita para utilizar la API sin limitaciones de evaluación.
Conclusión
En este artículo, discutimos la conversión de documentos PDF y Word a una hoja de cálculo de Excel en Java. Además, aprendimos cómo convertir cualquier parte del documento con opciones como marca de agua, zoom y protegerlo con contraseña.
Para obtener más opciones y ejemplos, visite la documentación y el repositorio GitHub. Para consultas, comuníquese con nosotros a través del foro.