Belgelerdeki gizli veya hassas bilgileri güvence altına almak mı istiyorsunuz? Bu, normal metin bilgisi veya resimli taranmış belge ile metin olsa bile yapılabilir. Kelimeleri aramak için farklı stratejiler ve birden fazla belgede eşanlamlı arama yapma konularını ele aldığımız önceki makaleler, aramanızı hassaslaştırmanıza yardımcı olabilir. Bu makale, Java kullanarak PDF metnini ve bir belgedeki resimlerdeki metni nasıl yeniden düzenleyeceğiniz konusunda size yol gösterir.

Aşağıdaki konular aşağıda ele alınacaktır:

Metin ve Görüntü Düzeltme için Java API

GroupDocs.Redaction, [sınıflandırılmış bilgileri güvence altına almak için düzeltme çözümü] sağlar7. Java API’si, çeşitli dosya biçimlerindeki belgelerdeki gizli bilgileri Java tabanlı uygulamalarınızdan çıkarmanıza veya çıkarmanıza olanak tanır. API, basit metin redaksiyonu ve rasterleştirmenin yanı sıra, en sık kullanılan taranmış PDF dosyaları gibi herhangi bir belgenin içinde olabilecek görüntülerdeki metnin tanımlanmasına da olanak tanır. Desteklenen dosya biçimlerinin tam listesi belgelerde mevcuttur.

İndirin veya Yapılandırın

JAR dosyasını indirilenler bölümünden indirebilir veya maven tabanlı Java uygulamalarınızın pom.xml dosyası için en son depo ve bağımlılık yapılandırmalarını edinebilirsiniz.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-redaction</artifactId>
        <version>21.6</version> 
</dependency>

Java kullanarak PDF Metnini ve Taranan Resim Metnini Reddet

Farklı [belgelerdeki metni bulma ve değiştirme yollarını] daha önce tartışmıştık]10. Ancak, resimlerin içindeki metni de düzeltebiliriz. Biraz metin ve ayrıca biraz metin içeren bir resim içeren aşağıdaki PDF belgesini kullanacağım. Bunun için OCR ile redaksiyon işlemini birleştirmemiz gerekiyor. İlk olarak, belgedeki metni ve ayrıca belgenin görüntüsünün içindeki metni tanımlayacağız. Ardından, taranmış bir belge görüntüsü içinde metin olsa bile herhangi bir yasal, gizli veya gizli bilgiyi programlı olarak gizlemek için bir kara kutu ile kapatacağız.

Metin ve taranmış resim içeren PDF

Aşağıdaki adımlar, normal metin veya katıştırılmış görüntülerde herhangi bir metin içeren PDF belgelerindeki metni algılar ve değiştirir.

  • Herhangi bir OCR Bağlayıcı kullanarak redaktör ayarlarını hazırlayın.
  • PDF dosyanızı Redactor sınıfını kullanarak ve ayrıca gerekli herhangi bir özel yükleme seçeneği varsa yükleyin.
  • Değiştirme seçeneklerinizi tanımlayın. Metni karartmayı seçiyorum.
  • Redaksiyonları hazırlayın; Phrase Redaction veya RegEx redaksiyon gibi uygun redaksiyon stratejisini kullanın.
  • uygula yöntemini kullanarak düzeltmeleri uygulayın.
  • Düzeltilmiş belgeyi kaydet yöntemini kullanarak kaydedin.

Aşağıdaki kaynak kodu, Java kullanarak bir PDF belgesindeki seçili metni yeniden düzenler.

// PDF'deki Metni ve Görüntüdeki Metni Java kullanarak taranmış belge gibi yeniden düzenleyin
RedactorSettings settings = new RedactorSettings(new AsposeCloudOcrConnector());
try (Redactor redactor = new Redactor("path/document.pdf", new LoadOptions(), settings))
{
    ReplacementOptions marker = new ReplacementOptions(java.awt.Color.BLACK);
    Redaction redactions[] = new Redaction[] {
            new RegexRedaction("(?<=Dear\\s)([^,]+)", marker), // cardholder name
            new RegexRedaction("\\d{2}/\\d{2}", marker), // valid thru
            new RegexRedaction("\\d{4}", marker)  // card number parts
        };
    RedactorChangeLog result = redactor.apply(redactions);
    if (result.getStatus() != RedactionStatus.Failed)
    {
        redactor.save(new SaveOptions(false, "redacted"));
    }
}

Yukarıdaki kodun çıktısı, PDF belgesinin karartılmış seçili metni ile aşağıdaki gibidir.

PDF metnini ve taranan resim metnini düzeltin

Ücretsiz API Lisansı Alın

API’yi değerlendirme sınırlamaları olmadan kullanmak için ücretsiz bir geçici lisans alabilirsiniz.

Çözüm

Sonuç olarak, belgelerdeki metni nasıl düzelteceğinizi öğrendiniz. Ek olarak, Java kullanarak bir PDF belgesindeki resimlerdeki metnin nasıl düzeltileceğini tartıştık. Benzer şekilde, diğer formattaki belgelerle metin ve resimleri yeniden düzenleyebilirsiniz. Biz düzenli ifadeler redaksiyonu kullandık, ancak bu birçok farklı yolla da yapılabilir. Daha sonra arama sonuçlarını bir kara kutu kullanarak sakladık.

API hakkında bilgi edinmek için daha fazla ayrıntı için belgeleri ziyaret edin. Sorularınız için forum aracılığıyla bize ulaşın.

Ayrıca bakınız