Если у вас есть табличные данные в формате документов PDF или Word, вам обязательно нужно преобразовать их в электронные таблицы Excel. Этот сценарий усложняется при наличии большого количества электронных таблиц или нескольких книг. Вам обязательно нужно автоматизировать эту процедуру. В этой статье мы увидим, как конвертировать PDF в Excel, а также как программно конвертировать документы Word в электронные таблицы Excel на C# с использованием .NET API.
В этой статье кратко обсуждаются следующие темы:
- .NET API — преобразование документов в электронные таблицы
- Преобразование PDF в Excel
- Преобразование Word в Excel
- Преобразование PDF или Word в электронную таблицу с дополнительными возможностями
.NET API — преобразование в форматы электронных таблиц
В этой статье я буду использовать GroupDocs.Conversion for .NET для преобразования документов PDF и Word в электронные таблицы с помощью C#. Это многофункциональный API, который позволяет преобразовывать документы и изображения во многие форматы файлов. Чтобы выделить некоторые форматы, API поддерживает текстовые документы, электронные таблицы, презентации, чертежи AutoCAD, электронные книги, PDF, файлы электронной почты, веб-страницы, изображения, файлы Photoshop и многие другие форматы документов.
Загрузите установщик DLL или MSI из раздела загрузок или установите API в свое приложение .NET через NuGet.
PM> Install-Package GroupDocs.Conversion
Преобразование PDF в Excel на C#
Ниже приведены шаги для преобразования документа PDF в электронную таблицу Excel.
- Загрузите файл PDF с помощью класса Converter.
- Инициализируйте параметр преобразования с помощью класса SpreadsheetConvertOptions.
- Вызвать метод Convert класса Converter с опцией.
В следующем примере кода показано, как преобразовать файл PDF в формат Excel XLSX с помощью C#.
// Преобразование PDF-документа в электронную таблицу Excel на С#
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Преобразование Word в Excel на C#
Вы можете преобразовать любой текстовый документ в электронную таблицу Excel так же, как мы преобразовали PDF-файл выше. Нам просто нужно предоставить правильный исходный файл для преобразования в XLS или XLSX.
Ниже приведены шаги для преобразования документа Word в формате DOC DOCX в электронную таблицу Excel.
- Загрузите файл Word с помощью класса Converter.
- Инициализируйте параметр преобразования с помощью класса SpreadsheetConvertOptions.
- Вызвать метод Convert класса Converter с опцией.
В следующем примере кода показано, как преобразовать файл DOC или DOCX в формат Excel XLSX с помощью C#.
// Преобразование документа Word в электронную таблицу Excel на С#
using (Converter converter = new Converter("document.docx"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Преобразование PDF или Word в электронную таблицу с дополнительными параметрами с использованием C#
Вы можете преобразовать только некоторые из выбранных страниц вашего документа. API дает вам право конвертировать документ с различными параметрами, включая:
- Начиная с Номера страницы.
- Количество страниц для преобразования.
- Определенные страницы для конверсии.
- Формат для преобразования.
- Пароль для защиты файла.
- Масштаб, чтобы увеличить или уменьшить его.
- Водяной знак на файле конвертера.
Ниже приведены шаги по преобразованию некоторых страниц файла PDF в формат XLSX с различным масштабированием с помощью C#.
// Преобразование второй страницы файла PDF в Excel на С# с некоторыми параметрами
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 2,
PagesCount = 1,
Format = SpreadsheetFileType.Xlsx,
Zoom = 150
};
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Вот файл PDF и преобразованная электронная таблица в виде вывода с использованием приведенного выше кода. Он преобразовал вторую страницу файла PDF в формат XLSX.
Получите бесплатную лицензию API
Вы можете получить бесплатную временную лицензию, чтобы использовать API без ограничений пробной версии.
Вывод
В этой статье вы узнали, как преобразовать документы PDF и Word в электронную таблицу Excel с помощью C#. Кроме того, вы также видели, как мы можем преобразовать любую часть документа с помощью таких параметров, как масштабирование, водяной знак и защита паролем. Теперь вы можете приступить к созданию собственного приложения для преобразования документов на базе .NET или интегрировать функции в существующее приложение.
Для получения дополнительной информации, вариантов и примеров вы можете посетить документацию и репозиторий GitHub. Если у вас возникнут дополнительные вопросы, обратитесь в службу поддержки на форуме.