Для даних у табличній формі документів PDF і Word іноді потрібно конвертувати їх в електронні таблиці Excel. Нам потрібно автоматизувати це перетворення якомога більшої кількості документів в електронні таблиці або кілька робочих книг. У цій статті буде обговорено, як програмно конвертувати документи Word у Excel, а також як конвертувати PDF-файли в електронні таблиці Excel у Java.

Перетворіть Word і PDF у Excel у Java

Тут коротко обговорюються такі теми:

Java API для перетворення в електронну таблицю

GroupDocs.Conversion for Java — це API, який дозволяє конвертувати документи PDF і Word в електронні таблиці у ваших програмах Java. API дозволяє конвертувати документи та зображення у багатьох форматах файлів. Деякі з підтримуваних форматів документів включають документи текстового процесора, електронні таблиці, презентації, електронні книги, формати AutoCAD, PDF, повідомлення електронної пошти, веб-сторінки, зображення.

Завантажте та налаштуйте

Ви можете отримати бібліотеку перетворення з розділу завантажень або додати наступну конфігурацію pom.xml у свою програму Java на основі Maven. Після цього ви можете спробувати приклади цієї статті, а також багато інших прикладів, доступних на GitHub. Щоб отримати докладніші відомості, ви можете відвідати Довідник API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

Конвертуйте PDF в Excel у Java

Для перетворення будь-якого PDF-документа в електронну таблицю Excel можна виконати наступні дії.

  • Завантажте файл PDF за допомогою класу Конвертер.
  • Підготуйте параметри перетворення за допомогою SpreadsheetConvertOptions.
  • Викличте метод convert зі створеними параметрами.

У наведеному нижче прикладі коду показано, як перетворити PDF-файл на електронну таблицю Excel XLSX у Java.

// Перетворіть PDF-документ на електронну таблицю Excel у Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

Перетворення Word на Excel у Java

Так само будь-який документ Word можна перетворити на електронну таблицю Excel так само, як ми щойно перетворили документ PDF. Надайте правильний вихідний файл і перетворіть його в XLS або XLSX.

Нижче наведено кроки для перетворення будь-якого файлу DOC DOCX на електронну таблицю Excel.

  • Завантажте файл DOC, DOCX за допомогою класу Converter.
  • Підготуйте параметри перетворення за допомогою SpreadsheetConvertOptions.
  • Викличте метод convert класу Converter з параметрами.

У наведеному нижче вихідному коді показано, як конвертувати файл DOC або DOCX у формат Excel XLSX у Java.

// Перетворіть документ Word на електронну таблицю Excel у Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

Перетворення PDF або Word на електронну таблицю з додатковими параметрами за допомогою Java

Ви не зобов’язані кожного разу конвертувати весь документ. Ви можете конвертувати лише вибрані сторінки документа. API дає вам право конвертувати документ із різними параметрами, зокрема:

  • Номер початкової сторінки.
  • Кількість сторінок.
  • Конкретні сторінки для перетворення.
  • Формат для перетворення.
  • Пароль для захисту файлу.
  • Збільште або зменшіть масштаб.
  • Водяний знак на файлі конвертера.

Нижче наведено кроки для того, як перетворити деякі сторінки файлу PDF у формат XLSX із різним масштабуванням у Java.

// Перетворіть другу сторінку PDF-файлу в Excel у Java з деякими параметрами
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

Тут показано PDF-файл і перетворену електронну таблицю як результат. Він перетворив другу сторінку файлу PDF у формат XLSX.

Програмно конвертуйте PDF у Excel XLS XLSX

Отримайте безкоштовну ліцензію API

Ви можете отримати безкоштовну тимчасову ліцензію, щоб використовувати API без оціночних обмежень.

Висновок

У цій статті ми обговорювали перетворення документів PDF і Word в електронну таблицю Excel на Java. Крім того, ми навчилися конвертувати будь-яку частину документа за допомогою таких опцій, як водяний знак, масштабування, і захистити її паролем.

Щоб отримати додаткові параметри та приклади, відвідайте документацію і репозиторій GitHub. Якщо у вас виникли запитання, зв’яжіться з нами через форум.

Дивись також