آیا می خواهید اطلاعات محرمانه یا حساسی را که در اسناد موجود است، ایمن کنید؟ حتی اگر این اطلاعات متنی معمولی باشد یا متنی با سند اسکن شده با تصاویر باشد، قابل انجام است. مقالات قبلی ممکن است به شما کمک کند جستجوی خود را اصلاح کنید، جایی که ما در مورد راهبردهای مختلف برای جستجوی کلمات و [مترادف های جستجو در چندین سند] بحث کردیم. این مقاله شما را راهنمایی می کند که چگونه متن و متن PDF را در تصاویر درون یک سند با استفاده از Java ویرایش کنید.

موضوعات زیر در زیر پوشش داده خواهد شد:

Java API برای ویرایش متن و تصویر

GroupDocs.Redaction [راه حل ویرایش برای ایمن سازی اطلاعات طبقه بندی شده] را ارائه می دهد. Java API به شما امکان می دهد اطلاعات محرمانه را در اسناد با فرمت های مختلف فایل از برنامه های کاربردی مبتنی بر Java حذف یا حذف کنید. در کنار ویرایش ساده و شطرنجی کردن متن، API همچنین امکان شناسایی متن در تصاویری را که ممکن است در داخل هر سندی مانند اکثر فایل‌های PDF اسکن شده رایج بوده باشد را می‌دهد. فهرست کامل فرمت‌های فایل پشتیبانی شده در اسناد موجود است.

دانلود یا پیکربندی کنید

می‌توانید فایل JAR را از بخش دانلودها دانلود کنید، یا فقط آخرین پیکربندی‌های مخزن و وابستگی را برای pom.xml برنامه‌های Java مبتنی بر maven خود دریافت کنید.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-redaction</artifactId>
        <version>21.6</version> 
</dependency>

با استفاده از جاوا، متن PDF و متن تصویر اسکن شده را ویرایش کنید

ما قبلاً در مورد [روش‌های یافتن و جایگزینی متن در اسناد10 بحث کرده‌ایم. با این حال، ما همچنین می توانیم متن را در تصاویر ویرایش کنیم. من از سند پی دی اف زیر استفاده خواهم کرد که حاوی مقداری متن و همچنین تصویری با مقداری متن است. برای این کار، باید OCR را با فرآیند ویرایش ترکیب کنیم. ابتدا متن داخل سند و همچنین متن داخل تصویر سند را شناسایی می کنیم. سپس، آن را با یک جعبه سیاه می پوشانیم تا هرگونه اطلاعات قانونی، محرمانه یا سری را به صورت برنامه ریزی شده پنهان کنیم، حتی اگر به صورت متن در یک تصویر سند اسکن شده باشد.

PDF با متن و تصویر اسکن شده

مراحل زیر متنی را در اسناد PDF که حاوی متن معمولی یا هر متنی در تصاویر جاسازی شده است، شناسایی و جایگزین می‌کند.

  • تنظیمات ویرایشگر را با استفاده از هر رابط OCR آماده کنید.
  • فایل PDF خود را با استفاده از کلاس Redactor بارگیری کنید و همچنین اگر گزینه های بارگیری خاصی مورد نیاز است.
  • [گزینه‌های جایگزین12 خود را تعریف کنید. من ترجیح می دهم متن را سیاه کنم.
  • ویرایش ها را آماده کنید؛ از استراتژی ویرایش مناسب مانند Phrase Redaction یا RegEx redaction استفاده کنید.
  • ویرایش ها را با استفاده از روش apply اعمال کنید.
  • سند ویرایش شده را با استفاده از روش save ذخیره کنید.

کد منبع زیر متن انتخاب شده را در یک سند PDF با استفاده از Java ویرایش می کند.

// ویرایش متن در PDF و متن در تصویر مانند سند اسکن شده با استفاده از جاوا
RedactorSettings settings = new RedactorSettings(new AsposeCloudOcrConnector());
try (Redactor redactor = new Redactor("path/document.pdf", new LoadOptions(), settings))
{
    ReplacementOptions marker = new ReplacementOptions(java.awt.Color.BLACK);
    Redaction redactions[] = new Redaction[] {
            new RegexRedaction("(?<=Dear\\s)([^,]+)", marker), // cardholder name
            new RegexRedaction("\\d{2}/\\d{2}", marker), // valid thru
            new RegexRedaction("\\d{4}", marker)  // card number parts
        };
    RedactorChangeLog result = redactor.apply(redactions);
    if (result.getStatus() != RedactionStatus.Failed)
    {
        redactor.save(new SaveOptions(false, "redacted"));
    }
}

خروجی کد بالا با متن انتخابی سیاه شده سند PDF به صورت زیر است.

متن PDF و متن تصویر اسکن شده را ویرایش کنید

مجوز API رایگان دریافت کنید

برای استفاده از API بدون محدودیت ارزیابی، می توانید [یک مجوز موقت رایگان دریافت کنید].

نتیجه

برای نتیجه گیری، شما یاد گرفته اید که چگونه متن را در اسناد ویرایش کنید. علاوه بر این، نحوه ویرایش متن در تصاویر در یک سند PDF با استفاده از Java را مورد بحث قرار دادیم. به طور مشابه، می توانید متن و تصاویر را با اسنادی با هر فرمت دیگری ویرایش کنید. ما از ویرایش عبارات منظم استفاده کردیم، با این حال، می توان آن را با استفاده از روش های مختلف نیز انجام داد. بعداً نتایج جستجو را با استفاده از یک جعبه سیاه پنهان کردیم.

برای اطلاعات بیشتر در مورد API، به مستندات مراجعه کنید. برای سؤالات، از طریق [فروم 19 با ما تماس بگیرید.

همچنین ببینید