Wir freuen uns, die GroupDocs.Parser for .NET 25.10‑Version anzukündigen, verfügbar ab Oktober 2025. Dieses Update bringt eine neue Tabellen‑Extraktionsfunktion, mehrere API‑Verbesserungen und einen kritischen Fix für die PDF‑Seitennummerierung.

Was ist neu in dieser Version

📄 Tabellen von jeder Seite extrahieren (PARSERNET‑2745)

Zwei Überladungen zu GroupDocs.Parser.Parser hinzugefügt, die es ermöglichen, Tabellenstrukturen direkt aus einem Dokument zu extrahieren, ohne eine Vorlage zu benötigen.

  • IEnumerable<PageTableArea> GetTables() – extrahiert Tabellen aus dem gesamten Dokument.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – extrahiert Tabellen von einer bestimmten Seite.

Hinweis: PageTableArea repräsentiert einen erkannten Tabellenbereich zusammen mit seinen Zellen, Seitenreferenz und Begrenzungsrechteck.

Beispiel – Tabellen von einer einzelnen Seite abrufen

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // erste Seite (nullbasiert)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // über Tabellen iterieren
    foreach (var table in tables)
    {
        // mit table.Cells, table.Page usw. arbeiten
    }
}

🔧 API-Redesign – interner PageTableArea‑Konstruktor (PARSERNET‑2743)

Der öffentliche Konstruktor von GroupDocs.Parser.Data.PageTableArea wurde entfernt und ist nun intern. Instanzen dieser Klasse werden ausschließlich von der Parser‑Engine erstellt, um eine versehentliche Fehlverwendung zu verhindern. Dies ist eine rückwärtsinkompatible Änderung für alle, die PageTableArea direkt instanziiert haben.

🐞 Fix – PDF‑Parsing auf die ersten 4 Seiten beschränkt (PARSERNET‑1871)

Der Parser verarbeitet nun korrekt alle Seiten eines PDF‑Dokuments. Zuvor wurden bei Aufruf der Parsing‑API nur die ersten vier Seiten zurückgegeben.

So erhalten Sie das Update

Ressourcen