我们很高兴宣布 GroupDocs.Editor for Python v26.5 已于 2026 年 5 月 正式发布。这是首个通过 .NET 以自包含的 Python wheel 形式在 PyPI 上发布的 GroupDocs.Editor for Python。它将底层 .NET 库的完整文档编辑功能带到 Python:加载文档、将其转换为干净的可编辑 HTML/CSS、在程序中或任意 WYSIWYG 编辑器中编辑该标记,然后再保存回原始格式——或转换为其他格式——只需一次 pip install,无需 MS Office、OpenOffice 或单独的 .NET 运行时。

本次发布的新增内容

  • [New feature] HTML 循环编辑 (EDTPY-1)
  • [New feature] 采用自动映射命名约定的 Pythonic API 表面 (EDTPY-2)
  • [New feature] 跨 Word 处理、电子表格、演示文稿、PDF、电子邮件、电子书以及文本/标记格式的多格式支持 (EDTPY-3)
  • [New feature] 通过 HTML 中间层进行格式转换 (EDTPY-4)
  • [New feature] 细粒度编辑(工作表/幻灯片/页面范围)并支持分页和语言元数据切换 (EDTPY-5)
  • [New feature] 资源提取(图像、字体、CSS、音频)及文件夹持久化 (EDTPY-6)
  • [New feature] 通过 get_document_info() 进行文档内部信息检查 (EDTPY-7)
  • [New feature] 通过 editor.form_field_manager 检查和更新表单字段 (EDTPY-8)
  • [New feature] 流加载和上下文管理器协议,实现确定性的资源释放 (EDTPY-9)
  • [New feature] AI Agent 与 LLM 友好:内置 AGENTS.md、MCP 服务器以及机器可读文档 (EDTPY-10)

公共 API 变更

整个 .NET API 通过 Python 原生命名方式暴露。类使用 PascalCase,方法和属性使用 snake_case(自动映射到底层 .NET 的 PascalCase),枚举值使用 UPPER_SNAKE_CASE

  • Editor — 入口点;可通过路径或流打开,提供 edit()save()get_document_info()form_field_manager
  • EditableDocument — HTML/CSS 表示;提供 get_content()get_body_content()get_embedded_html()get_css_content()save(),以及资源集合(imagesfontscssaudioall_resources),并支持 from_markup() / from_markup_and_resource_folder() / from_file() 工厂方法
  • FormFieldManager — 读取和更新 Word 处理表单字段
  • LicenseMetered — 授权 API

选项

  • 加载WordProcessingLoadOptionsSpreadsheetLoadOptionsPresentationLoadOptionsPdfLoadOptions
  • 编辑WordProcessingEditOptionsSpreadsheetEditOptionsPresentationEditOptionsPdfEditOptionsEbookEditOptionsEmailEditOptionsMarkdownEditOptionsTextEditOptionsXmlEditOptionsDelimitedTextEditOptions
  • 保存WordProcessingSaveOptionsSpreadsheetSaveOptionsPresentationSaveOptionsPdfSaveOptionsHtmlSaveOptionsMhtmlSaveOptionsMarkdownSaveOptionsXpsSaveOptionsTextSaveOptionsEbookSaveOptionsEmailSaveOptionsDelimitedTextSaveOptions

枚举

  • WordProcessingFormatsSpreadsheetFormatsPresentationFormatsFixedLayoutFormatsEBookFormatsEmailFormatsTextualFormatsFontExtractionOptionsFontEmbeddingOptions

异常

  • PasswordRequiredExceptionIncorrectPasswordExceptionEncryptedExceptionInvalidFormatException

新特性

HTML 循环编辑

将任何受支持的文档转换为可编辑的 HTML/CSS,并在不损失保真度的情况下保存回原始格式——这正是 GroupDocs.Editor 背后的核心工作流。HTML 可通过程序或任意第三方 WYSIWYG 编辑器(如 CKEditor、TinyMCE)进行编辑。

Pythonic API 表面

整个 .NET API 通过 Python 原生命名方式暴露。类使用 PascalCase,方法和属性使用 snake_case(自动映射到底层 .NET 的 PascalCase),枚举值使用 UPPER_SNAKE_CASE

多格式支持

在 Word 处理、电子表格、演示文稿、PDF、电子邮件、电子书以及文本/标记格式之间提供统一的 API。

通过 HTML 进行格式转换

无需单独的 “convert” 调用——使用不同的 *SaveOptions 保存 EditableDocument 时,会自动通过 HTML 中间层完成转换。输入相同,输出可变。

细粒度编辑

可编辑工作簿的单个工作表、幻灯片的单个页面或指定的页面范围,并可切换分页和语言元数据。

资源提取

EditableDocument 将提取的图像、字体、CSS 和音频以可迭代集合形式公开,并能够将 HTML 与所有资源一起持久化到文件夹中。

文档内部信息检查

在不进行完整编辑的情况下读取格式、页数、大小以及加密状态等信息。

表单字段

通过 editor.form_field_manager 检查并更新 Word 处理表单字段。

流与上下文管理器

支持从任意二进制流加载,并利用上下文管理器协议实现本机文档句柄的确定性释放。

AI Agent 与 LLM 友好

  • AGENTS.md 随安装的 wheel 一同提供——Claude Code、Cursor、GitHub Copilot 等可自动发现 API、使用模式和故障排除提示。
  • MCP 服务器——将你的 AI 工具指向 https://docs.groupdocs.com/mcp 以进行按需文档查询。
  • 机器可读文档 位于 https://docs.groupdocs.com/editor/python-net/llms-full.txt,用于检索增强生成(RAG)和 LLM 上下文。

代码示例

from groupdocs.editor import Editor, EditableDocument
from groupdocs.editor.formats import WordProcessingFormats
from groupdocs.editor.options import WordProcessingSaveOptions

with Editor("document.docx") as editor:
    editable = editor.edit()                       # document -> editable HTML
    html = editable.get_embedded_html()
    edited = EditableDocument.from_markup(html.replace("Hello", "Goodbye"))
    editor.save(edited, "document.docx", WordProcessingSaveOptions(WordProcessingFormats.DOCX))

获取更新的方式

PyPI

通过以下命令安装或升级:

pip install groupdocs-editor-net

直接下载

GroupDocs.Editor for Python via .NET 26.5 页面下载 wheel 包。

资源