En la era digital actual, la capacidad de convertir documentos PDF a formato HTML es cada vez más importante. Tanto si es un desarrollador que trabaja en un proyecto que requiere esta funcionalidad como si es un usuario que busca hacer que un documento PDF sea más accesible, comprender cómo convertir PDF a HTML en Java es esencial. En esta publicación de blog, lo guiaremos a través del proceso de conversión de documentos PDF a HTML usando Java.

Convierta PDF a HTML en CSharp.

Desarrolladores de Java: API de conversión de PDF a HTML

GroupDocs presenta la API de conversión de documentos e imágenes para desarrolladores de Java. Admite una gran lista de formatos de documentos e imágenes para la conversión de un formato a otro. Además, los resultados de la conversión también se pueden personalizar utilizando las opciones avanzadas disponibles. Usaré su GroupDocs.Conversion for Java API para convertir un documento PDF a formato HTML.

Descargar o Configurar

Puede descargar el archivo JAR de la sección de descargas, o simplemente obtener el repositorio y las configuraciones de dependencia para pom.xml de sus aplicaciones Java basadas en maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Cómo convertir PDF a HTML usando Java

Convertir un PDF a HTML usando Java es un proceso sencillo. Los siguientes pasos lo guiarán a través del proceso de convertir todas las páginas de un archivo PDF a formato HTML.

  • Utilice la clase Convertidor para cargar el archivo PDF.
  • Utilice el método Convert para transformar el documento cargado en formato HTML.

El siguiente código demuestra cómo convertir un documento PDF completo a HTML usando Java.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Convertir PDF a HTML en Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Conversión de páginas específicas de un PDF protegido en Java

También es posible convertir documentos PDF protegidos o bloqueados. Los siguientes pasos lo guiarán a través del proceso de convertir páginas específicas de un documento PDF bloqueado a formato HTML usando Java.

  • Use la clase PdfLoadOptions para preparar las opciones de carga.
  • Cargue el archivo PDF usando la clase Converter.
  • Utilice la clase WebConvertOptions para preparar las opciones de conversión para el formato HTML.
  • Defina las páginas específicas que se convertirán configurando propiedades como Páginas, Número de página, Número de páginas, Zoom, etc.
  • Finalmente, use el método Convert para transformar el archivo PDF cargado en formato HTML.

El siguiente código Java demuestra cómo convertir páginas seleccionadas de un documento PDF protegido por contraseña en HTML.

// Convierta páginas seleccionadas de PDF protegido con contraseña a HTML en Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Conclusión

En resumen, este artículo cubrió el tema de la conversión de documentos PDF a HTML en Java. Analizamos dos enfoques diferentes, incluida la conversión de todo el documento con opciones predeterminadas y la conversión de páginas específicas de un documento protegido con contraseña.

Para obtener más información sobre la API de automatización de conversiones de Java, consulte la documentación, Referencia de la API o consulte los ejemplos de GitHub. Si tiene más preguntas, no dude en comunicarse con nosotros a través del foro.

Ver también