Wenn Sie tabellarische Daten im PDF- oder Word-Format haben, müssen Sie diese unbedingt in Excel-Tabellen konvertieren. Dieses Szenario wird komplex, wenn viele Tabellenkalkulationen oder mehrere Arbeitsmappen vorhanden sind. Sie müssen diesen Vorgang sicherlich automatisieren. In diesem Artikel erfahren Sie, wie Sie PDF in Excel konvertieren und wie Sie Word-Dokumente programmgesteuert in C# mithilfe der .NET-API in Excel-Tabellen konvertieren.

Konvertieren Sie Word und PDF in C# in Excel

Die folgenden Themen werden in diesem Artikel kurz behandelt:

  • .NET API – Konvertieren Sie Dokumente in Tabellenkalkulationen
  • Konvertieren Sie PDF in Excel
  • Konvertieren Sie Word in Excel
  • PDF- oder Word-zu-Tabellen-Konvertierung mit mehr Optionen

.NET API - Konvertieren in Tabellenkalkulationsformate

In diesem Artikel werde ich GroupDocs.Conversion for .NET verwenden, um PDF- und Word-Dokumente mit C# in Tabellenkalkulationen zu konvertieren. Es ist die funktionsreiche API, die Dokumenten- und Bildkonvertierungen in vielen Dateiformaten ermöglicht. Um einige Formate hervorzuheben, unterstützt die API Textverarbeitungsdokumente, Tabellenkalkulationen, Präsentationen, AutoCAD-Zeichnungen, eBooks, PDF, E-Mail-Dateien, Webseiten, Bilder, Photoshop-Dateien und viele andere Dokumentformate.

Laden Sie das DLLs- oder MSI-Installationsprogramm aus dem Downloadbereich herunter oder installieren Sie die API in Ihrer .NET-Anwendung über NuGet.

PM> Install-Package GroupDocs.Conversion

Konvertieren Sie PDF in Excel in C#

Im Folgenden werden die Schritte zum Konvertieren eines PDF-Dokuments in eine Excel-Tabelle beschrieben.

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei mit C# in das Excel-XLSX-Format konvertieren.

// Konvertieren Sie ein PDF-Dokument in eine Excel-Tabelle in C#
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Konvertieren Sie Word in C# in Excel

Sie können jedes Word-Dokument auf die gleiche Weise in eine Excel-Tabelle konvertieren, wie wir die PDF-Datei oben konvertiert haben. Wir müssen nur die richtige Quelldatei für die Konvertierung in XLS oder XLSX bereitstellen.

Im Folgenden finden Sie die Schritte zum Konvertieren eines Word-Dokuments im DOC DOCX-Format in eine Excel-Tabelle.

  • Laden Sie die Word-Datei mit der Klasse Converter.
  • Initialisieren Sie die Konvertierungsoption mit der Klasse SpreadsheetConvertOptions.
  • Rufen Sie die Methode Convert der Converter-Klasse mit Option auf.

Das folgende Codebeispiel zeigt, wie Sie eine DOC- oder DOCX-Datei mithilfe von C# in das Excel-XLSX-Format konvertieren.

// Konvertieren Sie ein Word-Dokument in eine Excel-Tabelle in C#
using (Converter converter = new Converter("document.docx"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

PDF- oder Word-zu-Tabellen-Konvertierung mit mehr Optionen unter Verwendung von C#

Sie können nur einige der ausgewählten Seiten Ihres Dokuments konvertieren. Die API gibt Ihnen das Privileg, Ihr Dokument mit verschiedenen Optionen zu konvertieren, darunter:

  • Beginnende Seitenzahl.
  • Seitenzahl zum Konvertieren.
  • Spezielle Seiten für die Konvertierung.
  • Format zum Konvertieren.
  • Passwort, um die Datei zu schützen.
  • Zoomen, um es zu vergrößern oder zu verkleinern.
  • Wasserzeichen in der Konverterdatei.

Im Folgenden finden Sie die Schritte zum Konvertieren einiger Seiten einer PDF-Datei in das XLSX-Format mit unterschiedlichem Zoom mithilfe von C#.

// Konvertieren Sie die zweite Seite der PDF-Datei in C# mit einigen Optionen in Excel
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
    {
        PageNumber = 2,
        PagesCount = 1,
        Format = SpreadsheetFileType.Xlsx,
        Zoom = 150
    };
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

Hier sind die PDF-Datei und die konvertierte Tabelle als Ausgabe mit dem obigen Code. Es konvertierte die zweite Seite der PDF-Datei in das XLSX-Format.

Konvertieren Sie PDF programmgesteuert in Excel XLS XLSX

Holen Sie sich eine kostenlose API-Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie PDF- und Word-Dokumente mit C# in eine Excel-Tabelle konvertieren. Darüber hinaus haben Sie auch gesehen, wie wir jeden Teil des Dokuments mit Optionen wie Zoom, Wasserzeichen und Passwortschutz konvertieren können. Sie können jetzt damit beginnen, Ihre eigene .NET-basierte Dokumentkonvertierungsanwendung zu erstellen oder die Funktion(en) in Ihre vorhandene Anwendung zu integrieren.

Weitere Details, Optionen und Beispiele finden Sie in der Dokumentation und im GitHub-Repository. Wenden Sie sich bei weiteren Fragen an den Support im Forum.

Siehe auch