PDF 및 Word 문서의 표 형식 데이터의 경우 Excel 스프레드시트로 변환해야 하는 경우가 있습니다. 많은 문서를 스프레드시트나 여러 통합 문서로 변환하는 작업을 자동화해야 합니다. 이 기사에서는 프로그래밍 방식으로 Word 문서를 Excel로 변환하는 방법과 Java에서 PDF 파일을 Excel 스프레드시트로 변환하는 방법에 대해 설명합니다.
여기에서는 다음 주제에 대해 간략하게 설명합니다.
- Java API - 문서를 스프레드시트로 변환
- PDF를 Excel 스프레드시트로 변환
- Word를 Excel 스프레드시트로 변환
- 더 많은 옵션이 있는 PDF 또는 Word에서 스프레드시트로 변환
스프레드시트로의 변환을 위한 Java API
GroupDocs.Conversion for Java는 PDF 및 Word 문서를 Java 응용 프로그램 내에서 스프레드시트로 변환할 수 있는 API입니다. API는 다양한 파일 형식의 문서 및 이미지 변환을 허용합니다. 지원되는 문서 형식 중 일부에는 워드 프로세서 문서, 스프레드시트, 프리젠테이션, eBook, AutoCAD 형식, PDF, 이메일 메시지, 웹 페이지, 이미지가 포함됩니다.
다운로드 및 구성
다운로드 섹션에서 변환 라이브러리를 가져오거나 Maven 기반 Java 애플리케이션에 다음 pom.xml 구성을 추가할 수 있습니다. 그 후에 이 기사의 예제와 GitHub에서 사용할 수 있는 더 많은 예제를 시도할 수 있습니다. 자세한 내용은 API 참조를 참조하세요.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
Java에서 PDF를 Excel로 변환
다음 단계에 따라 PDF 문서를 Excel 스프레드시트로 변환할 수 있습니다.
- Converter 클래스를 사용하여 PDF 파일을 로드합니다.
- SpreadsheetConvertOptions를 사용하여 변환 옵션을 준비합니다.
- 생성된 옵션으로 convert 메소드를 호출합니다.
다음 코드 샘플은 Java에서 PDF 파일을 Excel XLSX 스프레드시트로 변환하는 방법을 보여줍니다.
// Java에서 PDF 문서를 Excel 스프레드시트로 변환
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
Java에서 Word를 Excel로 변환
마찬가지로, PDF 문서를 변환한 것과 같은 방식으로 모든 Word 문서를 Excel 스프레드시트로 변환할 수 있습니다. 올바른 소스 파일을 제공하고 XLS 또는 XLSX로 변환하십시오.
다음은 DOC DOCX 파일을 Excel 스프레드시트로 변환하는 단계입니다.
- Converter 클래스를 사용하여 DOC, DOCX 파일을 로드합니다.
- SpreadsheetConvertOptions를 사용하여 변환 옵션을 준비합니다.
- 옵션을 사용하여 Converter 클래스의 convert 메소드를 호출합니다.
다음 소스 코드는 Java에서 DOC 또는 DOCX 파일을 Excel XLSX 형식으로 변환하는 방법을 보여줍니다.
// Java에서 Word 문서를 Excel 스프레드시트로 변환
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
Java를 사용하여 더 많은 옵션이 있는 PDF 또는 Word에서 스프레드시트로 변환
매번 전체 문서를 변환해야 하는 것은 아닙니다. 문서에서 선택한 페이지만 변환할 수 있습니다. API는 다음을 포함하는 다양한 옵션으로 문서를 변환할 수 있는 권한을 제공합니다.
- 페이지 번호를 시작합니다.
- 페이지 수.
- 변환을 위한 특정 페이지.
- 형식으로 변환합니다.
- 암호는 파일을 보호하기 위한 것입니다.
- 확대/축소하여 확대 또는 축소합니다.
- 워터마크는 변환기 파일에 있습니다.
다음은 PDF 파일의 일부 페이지를 Java에서 다른 확대/축소를 사용하여 XLSX 형식으로 변환하는 방법에 대한 단계입니다.
// 일부 옵션을 사용하여 PDF 파일의 두 번째 페이지를 Java에서 Excel로 변환
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
PDF 파일과 출력으로 변환된 스프레드시트가 여기에 표시됩니다. PDF 파일의 두 번째 페이지를 XLSX 형식으로 변환했습니다.
무료 API 라이선스 받기
평가 제한 없이 API를 사용하기 위해 임시 무료 라이선스 받기를 할 수 있습니다.
결론
이 기사에서는 PDF 및 Word 문서를 Java에서 Excel 스프레드시트로 변환하는 방법에 대해 설명했습니다. 또한 워터마크, 확대/축소와 같은 옵션을 사용하여 문서의 일부를 변환하고 암호 보호를 사용하여 보호하는 방법을 배웠습니다.
더 많은 옵션과 예를 보려면 문서 및 GitHub 저장소를 방문하십시오. 문의 사항은 포럼을 통해 문의하십시오.