Jeśli masz dane tabelaryczne w formacie dokumentów PDF lub Word, zdecydowanie musisz przekonwertować je na arkusze kalkulacyjne Excel. Ten scenariusz staje się złożony, gdy istnieje wiele arkuszy kalkulacyjnych lub wiele skoroszytów. Na pewno musisz zautomatyzować tę procedurę. W tym artykule zobaczymy, jak konwertować pliki PDF na Excel, a także jak programowo konwertować dokumenty Word na arkusze kalkulacyjne Excel w języku C# przy użyciu interfejsu API .NET.
Oto tematy omówione pokrótce w tym artykule:
- .NET API — konwertuj dokumenty na arkusze kalkulacyjne
- Konwertuj PDF do Excela
- Konwertuj Worda na Excela
- Konwersja plików PDF lub Word na arkusz kalkulacyjny z większą liczbą opcji
Interfejs API platformy .NET — konwersja do formatów arkuszy kalkulacyjnych
W tym artykule użyję GroupDocs.Conversion for .NET do konwersji dokumentów PDF i Word na arkusze kalkulacyjne przy użyciu języka C#. Jest to bogaty w funkcje interfejs API, który umożliwia konwersję dokumentów i obrazów w wielu formatach plików. Aby wyróżnić niektóre formaty, interfejs API obsługuje dokumenty edytorów tekstu, arkusze kalkulacyjne, prezentacje, rysunki AutoCAD, eBooki, pliki PDF, pliki e-mail, strony internetowe, obrazy, pliki programu Photoshop i wiele innych formatów dokumentów.
Pobierz instalator bibliotek DLL lub MSI z sekcji pobierania lub zainstaluj interfejs API w swojej aplikacji .NET za pomocą NuGet.
PM> Install-Package GroupDocs.Conversion
Konwertuj PDF na Excel w C#
Poniżej przedstawiono krok konwersji dokumentu PDF do arkusza kalkulacyjnego Excel.
- Załaduj plik PDF za pomocą klasy Converter.
- Zainicjuj opcję konwersji przy użyciu klasy SpreadsheetConvertOptions.
- Wywołaj metodę Convert klasy Converter z opcją.
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format XLSX programu Excel przy użyciu języka C#.
// Konwertuj dokument PDF na arkusz kalkulacyjny Excel w języku C#
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Konwertuj Worda na Excela w C#
Możesz przekonwertować dowolny dokument Word na arkusz kalkulacyjny Excel w taki sam sposób, w jaki przekonwertowaliśmy powyższy plik PDF. Musimy tylko dostarczyć odpowiedni plik źródłowy do konwersji do formatu XLS lub XLSX.
Poniżej przedstawiono krok konwersji dokumentu Word w formacie DOC DOCX do arkusza kalkulacyjnego Excel.
- Załaduj plik Word, używając klasy Converter.
- Zainicjuj opcję konwersji przy użyciu klasy SpreadsheetConvertOptions.
- Wywołaj metodę Convert klasy Converter z opcją.
Poniższy przykładowy kod pokazuje, jak przekonwertować plik DOC lub DOCX na format XLSX programu Excel przy użyciu języka C#.
// Konwertuj dokument Word na arkusz kalkulacyjny Excel w C#
using (Converter converter = new Converter("document.docx"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Konwersja plików PDF lub Word na arkusz kalkulacyjny z większą liczbą opcji przy użyciu języka C#
Możesz konwertować tylko niektóre z wybranych stron dokumentu. Interfejs API umożliwia konwersję dokumentu za pomocą różnych opcji, które obejmują:
- Numer strony początkowej.
- Liczba stron do konwersji.
- Określone strony do konwersji.
- Format do przekonwertowania.
- Hasło do ochrony pliku.
- Powiększ, aby powiększyć lub pomniejszyć.
- Znak wodny w pliku konwertera.
Poniżej przedstawiono kroki konwersji niektórych stron pliku PDF do formatu XLSX z różnym powiększeniem przy użyciu języka C#.
// Konwertuj drugą stronę pliku PDF do Excela w C# z pewnymi opcjami
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 2,
PagesCount = 1,
Format = SpreadsheetFileType.Xlsx,
Zoom = 150
};
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Oto plik PDF i przekonwertowany arkusz kalkulacyjny jako dane wyjściowe przy użyciu powyższego kodu. Konwertował drugą stronę pliku PDF na format XLSX.
Uzyskaj bezpłatną licencję API
Możesz uzyskać bezpłatną tymczasową licencję, aby korzystać z API bez ograniczeń ewaluacyjnych.
Wniosek
W tym artykule nauczyłeś się konwertować dokumenty PDF i Word w arkuszu kalkulacyjnym Excel przy użyciu języka C#. Ponadto widziałeś również, jak możemy przekonwertować dowolną część dokumentu za pomocą opcji takich jak powiększenie, znak wodny i zabezpieczenie hasłem. Możesz teraz rozpocząć tworzenie własnej aplikacji do konwersji dokumentów opartej na platformie .NET lub zintegrować funkcje z istniejącą aplikacją.
Więcej informacji, opcji i przykładów można znaleźć w repozytorium documentation i GitHub. W przypadku dalszych pytań skontaktuj się z pomocą techniczną na forum.