Ingin mengamankan rahasia, atau informasi sensitif yang ada di dalam dokumen? Hal ini dapat dilakukan meskipun ini adalah informasi tekstual biasa atau teks dengan dokumen yang dipindai dengan gambar. Artikel sebelumnya dapat membantu Anda mempersempit pencarian Anda, di mana kami membahas strategi berbeda untuk mencari kata dan mencari sinonim dalam banyak dokumen. Artikel ini memandu Anda tentang cara menyunting teks PDF dan teks dalam gambar dalam dokumen menggunakan Java.

Topik-topik berikut akan dibahas di bawah ini:

API Java untuk Redaksi Teks dan Gambar

GroupDocs.Redaction menyediakan solusi redaksi untuk mengamankan informasi rahasia. Java API-nya memungkinkan Anda menyunting atau menghapus informasi rahasia di dalam dokumen dengan berbagai format file dari aplikasi berbasis Java Anda. Seiring dengan redaksi teks dan rasterisasi sederhana, API juga memungkinkan mengidentifikasi teks dalam gambar yang mungkin ada di dalam dokumen apa pun seperti file PDF pindaian yang paling umum digunakan. Daftar lengkap format file yang didukung tersedia di dokumentasi.

Unduh atau Konfigurasi

Anda dapat mengunduh file JAR dari bagian unduhan, atau dapatkan repositori terbaru dan konfigurasi dependensi untuk pom.xml aplikasi Java berbasis maven Anda.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-redaction</artifactId>
        <version>21.6</version> 
</dependency>

Redact Teks PDF dan Teks Gambar yang Dipindai menggunakan Java

Kami telah membahas berbagai cara menemukan dan mengganti teks dalam dokumen. Namun, kami juga dapat menyunting teks di dalam gambar. Saya akan menggunakan dokumen PDF berikut, yang berisi beberapa teks dan juga gambar dengan beberapa teks. Untuk ini, kita perlu menggabungkan OCR dengan proses redaksi. Pertama, kita akan mengidentifikasi teks dalam dokumen dan juga teks yang ada di dalam gambar dokumen. Kemudian, kami akan menutupinya dengan kotak hitam untuk menyembunyikan informasi legal, rahasia, atau rahasia apa pun secara terprogram meskipun berupa teks dalam gambar dokumen yang dipindai.

PDF dengan teks dan gambar yang dipindai

Langkah-langkah berikut akan mendeteksi dan mengganti teks dalam dokumen PDF, yang berisi teks biasa atau teks apa pun di dalam gambar yang disematkan.

  • Persiapkan pengaturan redaktor menggunakan Konektor OCR apa pun.
  • Muat file PDF Anda menggunakan kelas Redactor dan juga jika ada opsi pemuatan khusus yang diperlukan.
  • Tentukan [opsi penggantian] Anda 12. Saya memilih untuk menutup teks.
  • Siapkan redaksi; gunakan strategi redaksi yang sesuai seperti Frase Redaction atau RegEx redaction.
  • Terapkan redaksi menggunakan metode apply.
  • Simpan dokumen yang telah disunting menggunakan metode save.

Kode sumber berikut menyunting teks yang dipilih dalam dokumen PDF menggunakan Java.

// Redact Teks dalam PDF dan Teks dalam Gambar seperti dokumen yang dipindai menggunakan Java
RedactorSettings settings = new RedactorSettings(new AsposeCloudOcrConnector());
try (Redactor redactor = new Redactor("path/document.pdf", new LoadOptions(), settings))
{
    ReplacementOptions marker = new ReplacementOptions(java.awt.Color.BLACK);
    Redaction redactions[] = new Redaction[] {
            new RegexRedaction("(?<=Dear\\s)([^,]+)", marker), // cardholder name
            new RegexRedaction("\\d{2}/\\d{2}", marker), // valid thru
            new RegexRedaction("\\d{4}", marker)  // card number parts
        };
    RedactorChangeLog result = redactor.apply(redactions);
    if (result.getStatus() != RedactionStatus.Failed)
    {
        redactor.save(new SaveOptions(false, "redacted"));
    }
}

Output dari kode di atas adalah sebagai berikut dengan teks dokumen PDF yang dipilih dengan warna hitam.

Sunting teks PDF dan teks gambar yang dipindai

Dapatkan Lisensi API Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan API tanpa batasan evaluasi.

Kesimpulan

Sebagai kesimpulan, Anda telah mempelajari cara menyunting teks dalam dokumen. Selain itu, kami membahas cara menyunting teks pada gambar dalam dokumen PDF menggunakan Java. Demikian pula, Anda dapat menyunting teks dan gambar dengan dokumen dalam format lain apa pun. Kami menggunakan redaksi ekspresi reguler, namun, itu juga dapat dilakukan dengan berbagai cara. Kemudian kami menyembunyikan hasil pencarian menggunakan kotak hitam.

Untuk detail lebih lanjut untuk mempelajari tentang API, kunjungi dokumentasi. Untuk pertanyaan, hubungi kami melalui forum.

Lihat juga