最近,我们讨论了如何编辑不同文件格式的元数据属性。如果我们不需要文档中的元数据或选择性元数据属性怎么办?我们有多种选项来删除不同的元数据属性或简单地清除所有属性。我们可以使用简单的在线元数据清理工具来完成此操作,或者使用 C# 和 Java 以编程方式将其删除。让我们简单地看看这些选项。

在线元数据清理器

首先,让我们在线清除文档中不必要的元数据属性。您只需上传文档即可查看、编辑、更新、选择性删除和清理各种文件的所有元数据属性。在本文中,我使用 GroupDocs.Metadata 作为 Metadata Remover

在线 EPUB 元数据编辑器

以下是在线清理文档(从中删除所有元数据属性)的简单步骤:

  • 访问在线元数据清理器应用程序。
  • 使用以下两种简单方法之一上传文件:
    • 单击“打开文件”并浏览并选择您的文件。
    • 将文件拖放到指定区域。
  • 单击“清理元数据”按钮可删除已上传文件的属性。
  • 使用“下载”按钮,您可以保存不再包含任何元数据而仅包含其文件格式信息的文件。

就是这样!让我们通过删除所有不需要的元数据来清理您的文件。

元数据清理 - 开发人员指南

在线元数据删除太容易了。但是,如果您必须对大量不同格式的文档执行相同的操作,您可能不喜欢在线工具。以编程方式执行此操作是一个明显的选择。

在这里,我将向您介绍旨在使元数据清理过程变得更加容易的库。我将向您展示如何使用这些 API 以编程方式清理元数据。因此,准备好探索并选择最适合您需求的一个吧!

我们来清理它吧。

使用 C# 的元数据清理器

.NET 开发人员可以使用简单的几行 C# 代码立即清理各种文件格式的文档。

  • 使用 Metadata 类加载文档。
  • 使用 Sanitize 方法删除所有元数据属性。
  • 使用 Save 方法保存无元数据文档。

以下 C# 代码显示了从任何文档中清除元数据的上述步骤。

/*
* 从 Word、Excel、 
* 使用 C# 的 PowerPoint, PDF 和其他文档
*/
using (Metadata metadata = new Metadata("filePath/document.pdf"))
{
	var affected = metadata.Sanitize();
	metadata.Save("filePath/output.pdf");
}

同样,您还可以删除文档的任何选定元数据属性。有关详细指导,请参阅 使用 C# 的文档和图像元数据清理器 上的文章。

有关更多 .NET API 资源,请查看以下链接:

.NET API | 文档 | 下载

使用 Java 的元数据清理器

Java 程序员可以使用简单的几行代码直接选择从各种文件格式的文档中清除元数据属性。

  • 首先,使用 Metadata 类加载文档。
  • 然后,使用 sanitize 方法清理元数据属性。
  • 最后,使用 save 方法保存已删除元数据的文档。

以下 Java 代码显示了从文档中删除元数据的上述步骤。

/*
* 从 Word、Excel、 
* 使用 Java 的 PowerPoint, PDF 和其他文档
*/
Metadata metadata = new Metadata("filePath/document.pdf");
int affected = metadata.sanitize();
metadata.save("filePath/output.pdf"); // Save the output document with no metadata 

同样,您可以选择删除文档的任何选定元数据属性。有关更多详细信息,请参阅使用 Java 进行文档和图像的元数据清理 上的文章。

有关更多 Java API 资源,请浏览以下链接:

.NET API | 文档 | 下载

结论

在本文中,我们刚刚探索了元数据的清理世界。无论您是想在线清理文件的元数据,还是想使用 C# 或 Java 以编程方式清理文件,我们都能满足您的需求。

如果工具或 API 支持您的文件格式,请不要感到困惑。我相信您可以在支持的文件格式列表中找到您的文档格式。

有关详细的 API 信息,鼓励读者查阅相应的文档。问题和进一步讨论可以直接到提供的论坛

也可以看看