GroupDocs.Conversion for Python v26.3 现已发布。此版本新增了按页转换、内存流输出、Python 3.14 支持、AI‑agent 集成文件、增强的格式元数据以及多项改进。

本次发布的新功能

Key Category Summary
CONVERSIONPYTHON-65 Feature 通过 convert_by_page(output_dir, convert_options) 实现按页转换
CONVERSIONPYTHON-66 Feature 通过 convert_to_stream(convert_options) 实现内存转换
CONVERSIONPYTHON-62 Feature 支持 Python 3.14
CONVERSIONPYTHON-64 Feature 在包内提供 AGENTS.md 以供 AI Agent 集成
CONVERSIONPYTHON-67 Enhancement 格式对象公开 .extension.file_format.description 属性
CONVERSIONPYTHON-68 Enhancement 在 PyPI 元数据中显式添加 macOS 分类器

公共 API 变更

新功能方法 – 这些方法在 25.12 中已声明但抛出 NotImplementedError,现在已可使用:

Method Returns Description
Converter.convert_by_page(output_dir, convert_options) None 将文档拆分为每页一个文件,保存到指定目录
Converter.convert_to_stream(convert_options) bytes 将文档转换后以内存字节流返回

尚未可用的方法 – 以下方法在 Converter 类上作为属性代理存在,但在 Python 绑定中 尚未实现。调用它们会抛出异常:

Method Status Workaround
convert_by_page(file_path, page_number, convert_options) TypeError — 未公开 3 参数重载 使用 convert_options.page_number + convert_options.pages_count = 1convert(file_path, options)
convert_by_page(stream, page_number, convert_options) TypeError — 未公开 3 参数重载 先转换为文件,再读取到 io.BytesIO
convert_multiple(folder_path, convert_options) MissingMethodException 使用 convert(file_path, options) 对归档文件进行单文件合并输出

新特性

按页转换 – convert_by_page
Converter.convert_by_page(output_dir, convert_options) 方法现已完整实现。它会将多页文档拆分为单独的输出文件——每页一个——并保存到指定目录。页文件命名为 page_1.extpage_2.ext,依此类推。该方法适用于所有支持基于页输出的 ConvertOptions 类,如 ImageConvertOptionsPdfConvertOptionsWordProcessingConvertOptionsPresentationConvertOptions 等。

内存转换 – convert_to_stream
Converter.convert_to_stream(convert_options) 方法现在返回转换后的文档的 Python bytes 对象,支持在不写入磁盘的情况下进行内存转换流水线。这对于云函数、Web 应用以及文件系统访问受限或不希望使用磁盘的流式架构非常有用。

Python 3.14 支持
支持的 Python 版本范围从 3.5–3.13(25.12)扩展至 3.5–3.14Requires-Python 元数据已更新为 >=3.5,<3.15,PyPI 页面显式列出 Python 3.8 至 3.14 的分类器。

AGENTS.md – AI Agent 与 LLM 集成
groupdocs-conversion pip 包现在在 wheel 中的 groupdocs/conversion/AGENTS.md 路径下提供 AGENTS.md 文件。AI 编码助手(如 Claude Code、Cursor、GitHub Copilot)在扫描已安装的包时,可自动发现 API、使用模式、导入路径以及故障排除提示,无需手动指导。

格式对象属性
get_possible_conversions()get_all_possible_conversions() 返回的格式对象现在公开可读属性:

  • .extension – 如 'pdf'
  • .file_format – 如 'Portable Document Format'
  • .description – 如 'Portable Document Format File (pdf)'

之前这些对象显示为不透明的 <NetObject handle=NNN>;现在在 repr() 中显示为 <NetObject pdf>,并通过上述属性提供清晰的字符串值。

代码示例

import os
from groupdocs.conversion import Converter
from groupdocs.conversion.filetypes import ImageFileType
from groupdocs.conversion.options.convert import ImageConvertOptions

output_dir = "./converted-pages"
os.makedirs(output_dir, exist_ok=True)

with Converter("./presentation.pptx") as converter:
    options = ImageConvertOptions()
    options.format = ImageFileType.PNG
    converter.convert_by_page(output_dir, options)
    # 生成: page_1.png, page_2.png, ...

如何获取更新

PyPI

pip install --upgrade groupdocs-conversion

资源