We’re happy to announce the GroupDocs.Parser for .NET 25.10 release, available as of October 2025. This update brings a new table‑extraction capability, several API refinements, and a critical fix for PDF pagination.

Những cập nhật mới trong phiên bản này

📄 Trích xuất bảng từ bất kỳ trang nào (PARSERNET‑2745)

Đã thêm hai overload vào GroupDocs.Parser.Parser cho phép bạn lấy cấu trúc bảng trực tiếp từ tài liệu, mà không cần mẫu.

  • IEnumerable<PageTableArea> GetTables() – trích xuất các bảng từ toàn bộ tài liệu.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – trích xuất các bảng từ một trang cụ thể.

Lưu ý: PageTableArea đại diện cho vùng bảng được phát hiện cùng với các ô của nó, tham chiếu trang và hình chữ nhật bao quanh.

Ví dụ – Lấy bảng từ một trang duy nhất

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 Thiết kế lại API – hàm khởi tạo PageTableArea nội bộ (PARSERNET‑2743)

Hàm khởi tạo công khai của GroupDocs.Parser.Data.PageTableArea đã bị gỡ bỏ và hiện là nội bộ. Các thể hiện của lớp này chỉ được tạo bởi engine Parser, ngăn ngừa việc sử dụng nhầm. Đây là một thay đổi không tương thích ngược đối với bất kỳ ai đã khởi tạo PageTableArea trực tiếp.

🐞 Sửa lỗi – Phân tích PDF bị giới hạn ở 4 trang đầu (PARSERNET‑1871)

Bây giờ parser xử lý đúng tất cả các trang của tài liệu PDF. Trước đây, chỉ có bốn trang đầu tiên được trả về khi gọi API phân tích.

Cách nhận bản cập nhật

Tài nguyên