We很高興宣布 GroupDocs.Parser for .NET 25.10 版本已於 2025 年 10 月 上線。此更新帶來全新的表格抽取功能、數項 API 優化,以及 PDF 分頁的關鍵修復。

本次發行的新增功能

📄 從任意頁面抽取表格 (PARSERNET‑2745)

GroupDocs.Parser.Parser 中加入了兩個重載,讓您直接從文件中取得表格結構,無需使用範本。

  • IEnumerable<PageTableArea> GetTables() – 從整個文件抽取表格。
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – 從指定頁面抽取表格。

注意: PageTableArea 代表偵測到的表格區域,包含其儲存格、頁面參考與邊界矩形。

範例 – 從單一頁面取得表格

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 API 重新設計 – 內部 PageTableArea 建構函式 (PARSERNET‑2743)

GroupDocs.Parser.Data.PageTableArea 的公開建構函式已被移除,改為 internal。此類別的實例只能由 Parser 引擎建立,防止誤用。此變更不向後相容,對於直接實例化 PageTableArea 的使用者會產生影響。

🐞 修復 – PDF 解析僅限前 4 頁的問題 (PARSERNET‑1871)

解析器現在會正確處理 PDF 文件的所有頁面。先前呼叫解析 API 時,只會回傳前四頁。

取得更新的方式

相關資源