我们很高兴宣布 GroupDocs.Editor for Python v26.5 已于 2026 年 5 月 正式发布。这是首个通过 .NET 以自包含的 Python wheel 形式在 PyPI 上发布的 GroupDocs.Editor for Python。它将底层 .NET 库的完整文档编辑功能带到 Python:加载文档、将其转换为干净的可编辑 HTML/CSS、在程序中或任意 WYSIWYG 编辑器中编辑该标记,然后再保存回原始格式——或转换为其他格式——只需一次 pip install,无需 MS Office、OpenOffice 或单独的 .NET 运行时。
本次发布的新增内容
- [New feature] HTML 循环编辑 (EDTPY-1)
- [New feature] 采用自动映射命名约定的 Pythonic API 表面 (EDTPY-2)
- [New feature] 跨 Word 处理、电子表格、演示文稿、PDF、电子邮件、电子书以及文本/标记格式的多格式支持 (EDTPY-3)
- [New feature] 通过 HTML 中间层进行格式转换 (EDTPY-4)
- [New feature] 细粒度编辑(工作表/幻灯片/页面范围)并支持分页和语言元数据切换 (EDTPY-5)
- [New feature] 资源提取(图像、字体、CSS、音频)及文件夹持久化 (EDTPY-6)
- [New feature] 通过
get_document_info()进行文档内部信息检查 (EDTPY-7) - [New feature] 通过
editor.form_field_manager检查和更新表单字段 (EDTPY-8) - [New feature] 流加载和上下文管理器协议,实现确定性的资源释放 (EDTPY-9)
- [New feature] AI Agent 与 LLM 友好:内置
AGENTS.md、MCP 服务器以及机器可读文档 (EDTPY-10)
公共 API 变更
整个 .NET API 通过 Python 原生命名方式暴露。类使用 PascalCase,方法和属性使用 snake_case(自动映射到底层 .NET 的 PascalCase),枚举值使用 UPPER_SNAKE_CASE。
类
Editor— 入口点;可通过路径或流打开,提供edit()、save()、get_document_info()、form_field_managerEditableDocument— HTML/CSS 表示;提供get_content()、get_body_content()、get_embedded_html()、get_css_content()、save(),以及资源集合(images、fonts、css、audio、all_resources),并支持from_markup()/from_markup_and_resource_folder()/from_file()工厂方法FormFieldManager— 读取和更新 Word 处理表单字段License、Metered— 授权 API
选项
- 加载:
WordProcessingLoadOptions、SpreadsheetLoadOptions、PresentationLoadOptions、PdfLoadOptions - 编辑:
WordProcessingEditOptions、SpreadsheetEditOptions、PresentationEditOptions、PdfEditOptions、EbookEditOptions、EmailEditOptions、MarkdownEditOptions、TextEditOptions、XmlEditOptions、DelimitedTextEditOptions - 保存:
WordProcessingSaveOptions、SpreadsheetSaveOptions、PresentationSaveOptions、PdfSaveOptions、HtmlSaveOptions、MhtmlSaveOptions、MarkdownSaveOptions、XpsSaveOptions、TextSaveOptions、EbookSaveOptions、EmailSaveOptions、DelimitedTextSaveOptions
枚举
WordProcessingFormats、SpreadsheetFormats、PresentationFormats、FixedLayoutFormats、EBookFormats、EmailFormats、TextualFormats、FontExtractionOptions、FontEmbeddingOptions
异常
PasswordRequiredException、IncorrectPasswordException、EncryptedException、InvalidFormatException
新特性
HTML 循环编辑
将任何受支持的文档转换为可编辑的 HTML/CSS,并在不损失保真度的情况下保存回原始格式——这正是 GroupDocs.Editor 背后的核心工作流。HTML 可通过程序或任意第三方 WYSIWYG 编辑器(如 CKEditor、TinyMCE)进行编辑。
Pythonic API 表面
整个 .NET API 通过 Python 原生命名方式暴露。类使用 PascalCase,方法和属性使用 snake_case(自动映射到底层 .NET 的 PascalCase),枚举值使用 UPPER_SNAKE_CASE。
多格式支持
在 Word 处理、电子表格、演示文稿、PDF、电子邮件、电子书以及文本/标记格式之间提供统一的 API。
通过 HTML 进行格式转换
无需单独的 “convert” 调用——使用不同的 *SaveOptions 保存 EditableDocument 时,会自动通过 HTML 中间层完成转换。输入相同,输出可变。
细粒度编辑
可编辑工作簿的单个工作表、幻灯片的单个页面或指定的页面范围,并可切换分页和语言元数据。
资源提取
EditableDocument 将提取的图像、字体、CSS 和音频以可迭代集合形式公开,并能够将 HTML 与所有资源一起持久化到文件夹中。
文档内部信息检查
在不进行完整编辑的情况下读取格式、页数、大小以及加密状态等信息。
表单字段
通过 editor.form_field_manager 检查并更新 Word 处理表单字段。
流与上下文管理器
支持从任意二进制流加载,并利用上下文管理器协议实现本机文档句柄的确定性释放。
AI Agent 与 LLM 友好
AGENTS.md随安装的 wheel 一同提供——Claude Code、Cursor、GitHub Copilot 等可自动发现 API、使用模式和故障排除提示。- MCP 服务器——将你的 AI 工具指向
https://docs.groupdocs.com/mcp以进行按需文档查询。 - 机器可读文档 位于
https://docs.groupdocs.com/editor/python-net/llms-full.txt,用于检索增强生成(RAG)和 LLM 上下文。
代码示例
from groupdocs.editor import Editor, EditableDocument
from groupdocs.editor.formats import WordProcessingFormats
from groupdocs.editor.options import WordProcessingSaveOptions
with Editor("document.docx") as editor:
editable = editor.edit() # document -> editable HTML
html = editable.get_embedded_html()
edited = EditableDocument.from_markup(html.replace("Hello", "Goodbye"))
editor.save(edited, "document.docx", WordProcessingSaveOptions(WordProcessingFormats.DOCX))
获取更新的方式
PyPI
通过以下命令安装或升级:
pip install groupdocs-editor-net
直接下载
从 GroupDocs.Editor for Python via .NET 26.5 页面下载 wheel 包。