在其中一篇文章中,我們已經討論了作為 .NET 開發人員如何編輯文檔中的單詞。該策略以多種方式用於擦除敏感內容、隱藏或刪除電子郵件地址或身份證號碼等私人信息。本文討論如何在 Java 中的 Word DOC/DOCX 文檔中執行單詞搜索。我們將分別討論如何使用 Java API 進行編輯,使用不同的技術來查找和替換文本、單詞或短語。
想要保護文檔中的秘密或敏感信息?即使這是常規的文本信息,或者它是帶有圖像的掃描文檔的文本,也是可行的。之前的文章可能會幫助您優化搜索,我們在其中討論了[搜索詞的不同策略][1] 和[在多個文檔中搜索同義詞][2]。本文將指導您如何使用 Java 編輯文檔中的 PDF 文本和圖像中的文本。