Z przyjemnością ogłaszamy wydanie GroupDocs.Parser for .NET 25.10, dostępne od października 2025. Ta aktualizacja wprowadza nową funkcję wyodrębniania tabel, kilka udoskonaleń API oraz krytyczną poprawkę paginacji PDF.

Co nowego w tym wydaniu

📄 Wyodrębnianie tabel z dowolnej strony (PARSERNET‑2745)

Dodano dwa przeciążenia do GroupDocs.Parser.Parser, które umożliwiają pobieranie struktur tabel bezpośrednio z dokumentu, bez potrzeby szablonu.

  • IEnumerable<PageTableArea> GetTables() – wyodrębnia tabele z całego dokumentu.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – wyodrębnia tabele z konkretnej strony.

Uwaga: PageTableArea reprezentuje wykryty obszar tabeli wraz z jej komórkami, odniesieniem do strony i prostokątem ograniczającym.

Przykład – Pobieranie tabel z jednej strony

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // pierwsza strona (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iteracja po tabelach
    foreach (var table in tables)
    {
        // praca z table.Cells, table.Page, itp.
    }
}

🔧 Przebudowa API – wewnętrzny konstruktor PageTableArea (PARSERNET‑2743)

Publiczny konstruktor GroupDocs.Parser.Data.PageTableArea został usunięty i jest teraz wewnętrzny. Instancje tej klasy są tworzone wyłącznie przez silnik Parsera, co zapobiega przypadkowemu niewłaściwemu użyciu. Jest to zmiana niekompatybilna wstecz dla każdego, kto tworzył PageTableArea bezpośrednio.

🐞 Poprawka – parsowanie PDF ograniczone do pierwszych 4 stron (PARSERNET‑1871)

Parser teraz prawidłowo przetwarza wszystkie strony dokumentu PDF. Wcześniej przy wywołaniu API parsowania zwracane były tylko pierwsze cztery strony.

Jak uzyskać aktualizację

Zasoby