Якщо у вас є табличні дані у форматі документів PDF або Word, вам обов’язково потрібно перетворити їх на електронні таблиці Excel. Цей сценарій стає складнішим, якщо існує багато електронних таблиць або робочих книг. Вам обов’язково потрібно автоматизувати цю процедуру. У цій статті ми побачимо, як конвертувати PDF у Excel, а також як програмно конвертувати документи Word в електронні таблиці Excel на C# за допомогою .NET API.

Перетворення Word і PDF на Excel на C#

У цій статті коротко обговорюються такі теми:

  • .NET API – конвертуйте документи в електронні таблиці
  • Перетворення PDF в Excel
  • Перетворення Word на Excel
  • Конвертація PDF або Word в електронну таблицю з додатковими параметрами

.NET API - Перетворення у формати електронних таблиць

У цій статті я буду використовувати GroupDocs.Conversion for .NET для перетворення документів PDF і Word на електронні таблиці за допомогою C#. Це багатофункціональний API, який дозволяє конвертувати документи та зображення у багатьох форматах файлів. Щоб виділити деякі формати, API підтримує текстові документи, електронні таблиці, презентації, креслення AutoCAD, електронні книги, PDF, файли електронної пошти, веб-сторінки, зображення, файли Photoshop та багато інших форматів документів.

Завантажте інсталятор DLL або MSI із розділу завантажень або інсталюйте API у своїй програмі .NET за допомогою NuGet.

PM> Install-Package GroupDocs.Conversion

Перетворення PDF на Excel на C#

Нижче наведено етапи перетворення документа PDF на електронну таблицю Excel.

  • Завантажте файл PDF за допомогою класу Конвертер.
  • Ініціалізувати опцію перетворення за допомогою класу SpreadsheetConvertOptions.
  • Викличте метод Convert класу Converter з опцією.

У наведеному нижче прикладі коду показано, як конвертувати файл PDF у формат Excel XLSX за допомогою C#.

// Перетворення документа PDF на електронну таблицю Excel на C#
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Перетворення Word на Excel на C#

Ви можете конвертувати будь-який документ Word в електронну таблицю Excel так само, як ми конвертували PDF-файл вище. Нам просто потрібно надати правильний вихідний файл для перетворення в XLS або XLSX.

Нижче наведено кроки для перетворення документа Word із форматом DOC DOCX на електронну таблицю Excel.

  • Завантажте файл Word за допомогою класу Converter.
  • Ініціалізувати опцію перетворення за допомогою класу SpreadsheetConvertOptions.
  • Викличте метод Convert класу Converter з опцією.

У наведеному нижче прикладі коду показано, як перетворити файл DOC або DOCX у формат Excel XLSX за допомогою C#.

// Перетворення документа Word на електронну таблицю Excel на C#
using (Converter converter = new Converter("document.docx"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Перетворення PDF або Word на електронну таблицю з додатковими параметрами за допомогою C#

Ви можете конвертувати лише деякі з вибраних сторінок вашого документа. API дає вам привілей конвертувати ваш документ із різними параметрами, зокрема:

  • Номер початкової сторінки.
  • Кількість сторінок для конвертації.
  • Конкретні сторінки для перетворення.
  • Формат для перетворення.
  • Пароль для захисту файлу.
  • Збільште або зменшіть масштаб.
  • Водяний знак на файлі конвертера.

Нижче наведено кроки для того, як перетворити деякі сторінки файлу PDF у формат XLSX з іншим масштабуванням за допомогою C#.

// Перетворіть другу сторінку PDF-файлу в Excel на C# з деякими параметрами
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
    {
        PageNumber = 2,
        PagesCount = 1,
        Format = SpreadsheetFileType.Xlsx,
        Zoom = 150
    };
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Ось PDF-файл і перетворена електронна таблиця як вихідні дані за допомогою наведеного вище коду. Він перетворив другу сторінку файлу PDF у формат XLSX.

Програмно конвертуйте PDF у Excel XLS XLSX

Отримайте безкоштовну ліцензію API

Ви можете отримати безкоштовну тимчасову ліцензію, щоб використовувати API без оціночних обмежень.

Висновок

У цій статті ви дізналися, як конвертувати документи PDF і Word в електронну таблицю Excel за допомогою C#. Крім того, ви також бачили, як ми можемо конвертувати будь-яку частину документа за допомогою таких параметрів, як масштабування, водяний знак і захистити його паролем. Тепер ви можете розпочати створення власної програми для перетворення документів на базі .NET або інтегрувати функцію (функції) у свою існуючу програму.

Щоб отримати додаткові відомості, параметри та приклади, ви можете відвідати документацію і репозиторій GitHub. Щоб отримати додаткові запитання, зверніться до служби підтримки на форумі.

Дивись також