We’re happy to announce the GroupDocs.Parser for .NET 25.10 release, available as of October 2025. This update brings a new table‑extraction capability, several API refinements, and a critical fix for PDF pagination.

چه چیزهای جدید در این نسخه

📄 استخراج جدول‌ها از هر صفحه (PARSERNET‑2745)

دو overload به GroupDocs.Parser.Parser اضافه شد که امکان استخراج ساختار جدول‌ها را مستقیماً از یک سند، بدون نیاز به الگو، فراهم می‌کند.

  • IEnumerable<PageTableArea> GetTables() – جدول‌ها را از کل سند استخراج می‌کند.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – جدول‌ها را از صفحهٔ مشخص استخراج می‌کند.

توجه: PageTableArea نشان‌دهندهٔ ناحیه جدول شناسایی‌شده همراه با سلول‌های آن، ارجاع صفحه و مستطیل محاطی است.

مثال – استخراج جدول‌ها از یک صفحه

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 بازطراحی API – سازنده داخلی PageTableArea (PARSERNET‑2743)

سازندهٔ عمومی GroupDocs.Parser.Data.PageTableArea حذف شده و الآن داخلی است. نمونه‌های این کلاس به‌صورت انحصاری توسط موتور Parser ساخته می‌شوند، که از استفادهٔ ناخواسته جلوگیری می‌کند. این تغییر برای هرکسی که PageTableArea را به‌صورت مستقیم نمونه‌سازی می‌کرد، ناسازگار با نسخه‌های قبلی است.

🐞 رفع مشکل – محدودیت پردازش PDF به ۴ صفحهٔ اول (PARSERNET‑1871)

اکنون پردازش‌کننده همهٔ صفحات یک سند PDF را به‌درستی پردازش می‌کند. پیش از این، هنگام فراخوانی API پردازش، تنها چهار صفحهٔ اول بازگردانده می‌شد.

چگونه این به‌روزرسانی را دریافت کنیم

منابع