Template banyak digunakan untuk menghasilkan dokumen yang disesuaikan. Artikel ini memandu tentang cara menemukan dan mengganti teks dan kata dalam dokumen PDF menggunakan C#. Kami akan membahas secara terpisah cara mengganti kata dan frasa secara terprogram, mengganti kata dengan pencarian peka huruf besar kecil, mengganti menggunakan ekspresi reguler. Terakhir, kita juga akan mempelajari cara menyembunyikan string yang dicari menggunakan C#.

Topik-topik berikut akan dibahas di bawah ini:

.NET Redaction API untuk Mengganti Teks

GroupDocs menampilkan GroupDocs.Redaction for .NET, API untuk menyunting, menyembunyikan, atau menghapus konten & bahkan metadata dokumen, presentasi, spreadsheet, file PDF, dan gambar dalam aplikasi .NET. Untuk detail lebih lanjut tentang API, kunjungi dokumentasinya.

Anda dapat mendownload penginstal DLL atau MSI dari bagian download atau instal API di aplikasi .NET Anda melalui [NuGet](https://www.nuget.org /packages/groupdocs.redaction).

PM> Install-Package GroupDocs.Redaction

Tidak perlu menginstal editor PDF apa pun, atau perangkat lunak pihak ketiga lainnya untuk penyuntingan. Berikut ini adalah tangkapan layar dari dokumen PDF yang digunakan dalam contoh di bawah ini. Pendekatan yang sama akan bekerja untuk format dokumen lain dengan sedikit atau tanpa perubahan kode.

Temukan dan Ganti Kata atau Frasa dalam PDF menggunakan C#

Anda dapat menggunakan fitur ini untuk menyembunyikan data rahasia apa pun, dan juga untuk membuat dokumen kustom baru dari template. Langkah berikut menjelaskan cara menemukan kata/frasa apa pun dalam dokumen PDF dengan beberapa teks lain di dalam aplikasi C#.

Kode berikut menemukan dan mengganti kata dalam C#. Lebih tepatnya, ini menyembunyikan semua kemunculan “John Doe” dengan menggantinya dengan kata “[disensor]”.

// Temukan frasa yang tepat dan ganti dengan beberapa teks lain menggunakan C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Output dari kode adalah sebagai berikut.

Temukan dan Ganti Teks atau Frasa Peka Huruf Besar dalam PDF menggunakan C#

Anda dapat melakukan pencarian & redaksi peka huruf besar-kecil. Kode berikut menggantikan keberadaan peka huruf besar kecil dari kata “John Doe” tetapi bukan “john doe” di C#.

// Temukan frasa yang tepat (peka huruf besar/kecil) dan ganti dengan beberapa teks lain menggunakan C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", true /*isCaseSensitive*/, new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Output dari kode adalah sebagai berikut.

Ganti Teks dalam PDF dengan Ekspresi Reguler (RegEx) menggunakan C#

Anda juga dapat mengganti pola teks tertentu menggunakan ekspresi reguler. Langkah-langkah berikut memungkinkan Anda menyunting PDF setelah pencarian menggunakan ekspresi reguler (RegEx) dalam aplikasi .NET Anda.

Kode berikut menunjukkan cara menemukan pola teks tertentu dalam dokumen PDF menggunakan RegEx dan kemudian mengganti/menyembunyikannya dengan beberapa teks lain menggunakan C#.

// Temukan teks menggunakan ekspresi reguler dan ganti dengan teks lain menggunakan C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Output dari kode di atas adalah sebagai berikut.

Ganti Teks dengan Kotak Berwarna di C#

Jika Anda hanya ingin menyembunyikan konten yang dicari (informasi pribadi) dari file PDF Anda, Anda cukup menutupinya. API memungkinkan Anda menyembunyikan teks yang dicari. Kode C# berikut menempatkan kotak hitam di atas teks pribadi yang disebutkan.

// Temukan teks dalam PDF dan sembunyikan dengan menggambar persegi panjang di atasnya menggunakan C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions(System.Drawing.Color.Black)));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Output dari kode di atas adalah sebagai berikut.

Dapatkan Lisensi API Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan API tanpa batasan evaluasi.

Kesimpulan

Sebagai penutup, kami mempelajari cara menemukan teks tertentu dalam file PDF menggunakan teknik pencarian yang berbeda. Nanti kami membahas cara menyunting file PDF baik dengan mengganti atau menyembunyikan teks di dalam aplikasi .NET menggunakan C#. Lebih tepatnya, kami hanya mencari kata, frasa, mencari dengan sensitivitas huruf besar-kecil, dan dengan menggunakan ekspresi reguler di C#. Terakhir, kami mengganti hasil pencarian dengan teks lain atau dengan menyembunyikannya dengan kotak persegi panjang di atasnya.

Untuk detail selengkapnya tentang API, kunjungi dokumentasi. Untuk pertanyaan, hubungi kami melalui forum.

Lihat juga