We zijn blij de GroupDocs.Parser for .NET 25.10-release aan te kondigen, beschikbaar vanaf oktober 2025. Deze update brengt een nieuwe tabel‑extractie‑functionaliteit, verschillende API‑verbeteringen en een kritieke oplossing voor PDF‑paginering.

Wat is er nieuw in deze release

📄 Tabellen extraheren van elke pagina (PARSERNET‑2745)

Er zijn twee overloads toegevoegd aan GroupDocs.Parser.Parser waarmee je tabelstructuren rechtstreeks uit een document kunt halen, zonder een template te hoeven gebruiken.

  • IEnumerable<PageTableArea> GetTables() – extraheert tabellen uit het volledige document.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – extraheert tabellen uit een specifieke pagina.

Opmerking: PageTableArea vertegenwoordigt een gedetecteerde tabelregio samen met de cellen, paginareferentie en omvattende rechthoek.

Voorbeeld – Tabellen ophalen van een enkele pagina

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 API-herontwerp – interne PageTableArea‑constructor (PARSERNET‑2743)

De openbare constructor van GroupDocs.Parser.Data.PageTableArea is verwijderd en is nu intern. Instanties van deze klasse worden uitsluitend aangemaakt door de Parser‑engine, waardoor per ongeluk misbruik wordt voorkomen. Dit is een terugwaarts‑onverenigbare wijziging voor iedereen die PageTableArea direct heeft geïnstantieerd.

🐞 Oplossing – PDF‑parsen beperkt tot de eerste 4 pagina’s (PARSERNET‑1871)

De parser verwerkt nu correct alle pagina’s van een PDF‑document. Voorheen werden bij het aanroepen van de parsing‑API slechts de eerste vier pagina’s geretourneerd.

Hoe de update te verkrijgen

Bronnen