Если у вас есть табличные данные в формате документов PDF или Word, вам обязательно нужно преобразовать их в электронные таблицы Excel. Этот сценарий усложняется при наличии большого количества электронных таблиц или нескольких книг. Вам обязательно нужно автоматизировать эту процедуру. В этой статье мы увидим, как конвертировать PDF в Excel, а также как программно конвертировать документы Word в электронные таблицы Excel на C# с использованием .NET API.

Преобразование Word и PDF в Excel на C#

В этой статье кратко обсуждаются следующие темы:

  • .NET API — преобразование документов в электронные таблицы
  • Преобразование PDF в Excel
  • Преобразование Word в Excel
  • Преобразование PDF или Word в электронную таблицу с дополнительными возможностями

.NET API — преобразование в форматы электронных таблиц

В этой статье я буду использовать GroupDocs.Conversion for .NET для преобразования документов PDF и Word в электронные таблицы с помощью C#. Это многофункциональный API, который позволяет преобразовывать документы и изображения во многие форматы файлов. Чтобы выделить некоторые форматы, API поддерживает текстовые документы, электронные таблицы, презентации, чертежи AutoCAD, электронные книги, PDF, файлы электронной почты, веб-страницы, изображения, файлы Photoshop и многие другие форматы документов.

Загрузите установщик DLL или MSI из раздела загрузок или установите API в свое приложение .NET через NuGet.

PM> Install-Package GroupDocs.Conversion

Преобразование PDF в Excel на C#

Ниже приведены шаги для преобразования документа PDF в электронную таблицу Excel.

  • Загрузите файл PDF с помощью класса Converter.
  • Инициализируйте параметр преобразования с помощью класса SpreadsheetConvertOptions.
  • Вызвать метод Convert класса Converter с опцией.

В следующем примере кода показано, как преобразовать файл PDF в формат Excel XLSX с помощью C#.

// Преобразование PDF-документа в электронную таблицу Excel на С#
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Преобразование Word в Excel на C#

Вы можете преобразовать любой текстовый документ в электронную таблицу Excel так же, как мы преобразовали PDF-файл выше. Нам просто нужно предоставить правильный исходный файл для преобразования в XLS или XLSX.

Ниже приведены шаги для преобразования документа Word в формате DOC DOCX в электронную таблицу Excel.

  • Загрузите файл Word с помощью класса Converter.
  • Инициализируйте параметр преобразования с помощью класса SpreadsheetConvertOptions.
  • Вызвать метод Convert класса Converter с опцией.

В следующем примере кода показано, как преобразовать файл DOC или DOCX в формат Excel XLSX с помощью C#.

// Преобразование документа Word в электронную таблицу Excel на С#
using (Converter converter = new Converter("document.docx"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Преобразование PDF или Word в электронную таблицу с дополнительными параметрами с использованием C#

Вы можете преобразовать только некоторые из выбранных страниц вашего документа. API дает вам право конвертировать документ с различными параметрами, включая:

  • Начиная с Номера страницы.
  • Количество страниц для преобразования.
  • Определенные страницы для конверсии.
  • Формат для преобразования.
  • Пароль для защиты файла.
  • Масштаб, чтобы увеличить или уменьшить его.
  • Водяной знак на файле конвертера.

Ниже приведены шаги по преобразованию некоторых страниц файла PDF в формат XLSX с различным масштабированием с помощью C#.

// Преобразование второй страницы файла PDF в Excel на С# с некоторыми параметрами
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
    {
        PageNumber = 2,
        PagesCount = 1,
        Format = SpreadsheetFileType.Xlsx,
        Zoom = 150
    };
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Вот файл PDF и преобразованная электронная таблица в виде вывода с использованием приведенного выше кода. Он преобразовал вторую страницу файла PDF в формат XLSX.

Преобразование PDF в Excel XLS XLSX программно

Получите бесплатную лицензию API

Вы можете получить бесплатную временную лицензию, чтобы использовать API без ограничений пробной версии.

Вывод

В этой статье вы узнали, как преобразовать документы PDF и Word в электронную таблицу Excel с помощью C#. Кроме того, вы также видели, как мы можем преобразовать любую часть документа с помощью таких параметров, как масштабирование, водяной знак и защита паролем. Теперь вы можете приступить к созданию собственного приложения для преобразования документов на базе .NET или интегрировать функции в существующее приложение.

Для получения дополнительной информации, вариантов и примеров вы можете посетить документацию и репозиторий GitHub. Если у вас возникнут дополнительные вопросы, обратитесь в службу поддержки на форуме.

Смотрите также