Для даних у табличній формі документів PDF і Word іноді потрібно конвертувати їх в електронні таблиці Excel. Нам потрібно автоматизувати це перетворення якомога більшої кількості документів в електронні таблиці або кілька робочих книг. У цій статті буде обговорено, як програмно конвертувати документи Word у Excel, а також як конвертувати PDF-файли в електронні таблиці Excel у Java.
Тут коротко обговорюються такі теми:
- Java API - перетворення документів на електронні таблиці
- Перетворення PDF на електронну таблицю Excel
- Перетворення Word на електронну таблицю Excel
- Конвертація PDF або Word в електронну таблицю з додатковими параметрами
Java API для перетворення в електронну таблицю
GroupDocs.Conversion for Java — це API, який дозволяє конвертувати документи PDF і Word в електронні таблиці у ваших програмах Java. API дозволяє конвертувати документи та зображення у багатьох форматах файлів. Деякі з підтримуваних форматів документів включають документи текстового процесора, електронні таблиці, презентації, електронні книги, формати AutoCAD, PDF, повідомлення електронної пошти, веб-сторінки, зображення.
Завантажте та налаштуйте
Ви можете отримати бібліотеку перетворення з розділу завантажень або додати наступну конфігурацію pom.xml у свою програму Java на основі Maven. Після цього ви можете спробувати приклади цієї статті, а також багато інших прикладів, доступних на GitHub. Щоб отримати докладніші відомості, ви можете відвідати Довідник API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
Конвертуйте PDF в Excel у Java
Для перетворення будь-якого PDF-документа в електронну таблицю Excel можна виконати наступні дії.
- Завантажте файл PDF за допомогою класу Конвертер.
- Підготуйте параметри перетворення за допомогою SpreadsheetConvertOptions.
- Викличте метод convert зі створеними параметрами.
У наведеному нижче прикладі коду показано, як перетворити PDF-файл на електронну таблицю Excel XLSX у Java.
// Перетворіть PDF-документ на електронну таблицю Excel у Java
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
Перетворення Word на Excel у Java
Так само будь-який документ Word можна перетворити на електронну таблицю Excel так само, як ми щойно перетворили документ PDF. Надайте правильний вихідний файл і перетворіть його в XLS або XLSX.
Нижче наведено кроки для перетворення будь-якого файлу DOC DOCX на електронну таблицю Excel.
- Завантажте файл DOC, DOCX за допомогою класу Converter.
- Підготуйте параметри перетворення за допомогою SpreadsheetConvertOptions.
- Викличте метод convert класу Converter з параметрами.
У наведеному нижче вихідному коді показано, як конвертувати файл DOC або DOCX у формат Excel XLSX у Java.
// Перетворіть документ Word на електронну таблицю Excel у Java
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
Перетворення PDF або Word на електронну таблицю з додатковими параметрами за допомогою Java
Ви не зобов’язані кожного разу конвертувати весь документ. Ви можете конвертувати лише вибрані сторінки документа. API дає вам право конвертувати документ із різними параметрами, зокрема:
- Номер початкової сторінки.
- Кількість сторінок.
- Конкретні сторінки для перетворення.
- Формат для перетворення.
- Пароль для захисту файлу.
- Збільште або зменшіть масштаб.
- Водяний знак на файлі конвертера.
Нижче наведено кроки для того, як перетворити деякі сторінки файлу PDF у формат XLSX із різним масштабуванням у Java.
// Перетворіть другу сторінку PDF-файлу в Excel у Java з деякими параметрами
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
Тут показано PDF-файл і перетворену електронну таблицю як результат. Він перетворив другу сторінку файлу PDF у формат XLSX.
Отримайте безкоштовну ліцензію API
Ви можете отримати безкоштовну тимчасову ліцензію, щоб використовувати API без оціночних обмежень.
Висновок
У цій статті ми обговорювали перетворення документів PDF і Word в електронну таблицю Excel на Java. Крім того, ми навчилися конвертувати будь-яку частину документа за допомогою таких опцій, як водяний знак, масштабування, і захистити її паролем.
Щоб отримати додаткові параметри та приклади, відвідайте документацію і репозиторій GitHub. Якщо у вас виникли запитання, зв’яжіться з нами через форум.