ما اغلب نیاز داریم که اطلاعات محرمانه و حساس را در اسناد پنهان کنیم. در مقالات دیگر، راهبردهای مختلف برای جستجوی کلمات و حتی [مترادف‌های جستجو در اسناد متعدد2 را مورد بحث قرار داده‌ایم. این مقاله شما را راهنمایی می کند که چگونه متن و متن PDF را در تصاویر درون یک سند با استفاده از C# ویرایش کنید.

موضوعات زیر در زیر پوشش داده خواهد شد:

NET API برای ویرایش متن و تصویر

GroupDocs.Redaction [API .NET. ویرایش سند6 را فراهم می کند که امکان پنهان کردن و حذف اطلاعات محرمانه را در اسناد با فرمت های مختلف فایل فراهم می کند. در کنار ویرایش ساده و شطرنجی کردن متن، API همچنین امکان شناسایی متن در تصاویری را که ممکن است در داخل هر سندی مانند اکثر فایل‌های PDF اسکن شده رایج بوده باشد را می‌دهد. فهرست کامل فرمت‌های فایل پشتیبانی شده در اسناد موجود است.

می توانید نصب کننده DLL یا MSI را از بخش دانلودها دانلود کنید یا از طریق NuGet API را در برنامه .NET خود نصب کنید.

از طریق Package Manager Console نصب کنید

PM> Install-Package GroupDocs.Redaction

از طریق NuGet Package Manager نصب کنید

GroupDocs.Redaction - بسته NuGet - نصب کنید

ویرایش متن PDF و متن تصویر اسکن شده با استفاده از C#

10 راه‌های مختلفی برای یافتن و جایگزینی متن در اسناد وجود دارد که قبلاً مورد بحث قرار گرفته‌اند. می توانید کلمات خاصی را در هر سندی پیدا کنید، با حساسیت حروف کوچک و بزرگ یا با استفاده از عبارات منظم پیدا کنید. من از سند پی دی اف زیر استفاده خواهم کرد که حاوی مقداری متن و همچنین یک تصویر با مقداری متن در آن است. در اینجا ما فرآیند OCR و ویرایش را با استفاده از GroupDocs.Redaction for .NET ترکیب می کنیم. ابتدا متن داخل سند و همچنین متن داخل تصویر سند را شناسایی می کنیم. ثانیاً، ما آن را با یک جعبه سیاه می پوشانیم تا نشان دهیم چگونه می توان هرگونه اطلاعات قانونی یا محرمانه را به صورت برنامه ریزی شده پنهان کرد، حتی اگر به صورت متن در یک تصویر سند اسکن شده باشد.

PDF با متن و تصویر اسکن شده

مراحل زیر متن را در یک سند PDF، که حاوی متن معمولی به همراه مقداری متن در یک تصویر جاسازی شده است، شناسایی و جایگزین می‌کند.

  • تنظیمات ویرایشگر را با استفاده از هر رابط OCR آماده کنید.
  • سند PDF را با استفاده از کلاس Redactor با تنظیمات آماده شده و هر گزینه بارگیری خاص بارگیری کنید.
  • [گزینه جایگزین12 را تعریف کنید. من تعریف کرده ام که متن را سیاه کنم.
  • برای ویرایش متن، از استراتژی انتخاب متن مناسب استفاده کنید. من از RegEx استفاده کرده ام.
  • ویرایش ها را با استفاده از روش Apply اعمال کنید.
  • سند ویرایش شده را با استفاده از روش Save ذخیره کنید.

کد منبع زیر متن انتخاب شده را در یک سند PDF با استفاده از C# ویرایش می کند.

// ویرایش متن در PDF و متن در تصویر مانند سند اسکن شده با استفاده از C#
var settings = new RedactorSettings(new AsposeOCRStandaloneConnector(@"LICENSE_PATH"));
using (var redactor = new Redactor(@"path/document.pdf", new LoadOptions(), settings))
{
    var marker = new ReplacementOptions(Color.Black);
    var redactions = new Redaction[] {
        new RegexRedaction(@"(?<=Dear\s+)([^,]+)", marker), // Card Holder Name
        new RegexRedaction(@"\d{2}/\d{2}", marker), // Valid Thru
        new RegexRedaction(@"\d{4}", marker)  // Card Number
    };
    var result = redactor.Apply(redactions);
    if (result.Status != RedactionStatus.Failed)
    {
        redactor.Save(new SaveOptions(false, "OnPremise"));
    }
}

خروجی کد بالا به صورت زیر است که متن انتخابی سند PDF را سیاه می کند.

متن PDF و متن تصویر اسکن شده را ویرایش کنید

یک مجوز API رایگان دریافت کنید

برای استفاده از API بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.

نتیجه

به طور خلاصه، شما یاد گرفته اید که متن را در اسناد ویرایش کنید. مهمتر و دقیق تر، ما در مورد چگونگی ویرایش متن در تصاویر در یک سند PDF با استفاده از C# بحث کردیم. ما متن را برای ویرایش با استفاده از عبارات منظم انتخاب کردیم، با این حال، همانطور که قبلاً بحث شد، می توان آن را با استفاده از روش های مختلف انتخاب کرد. بعداً نتایج جستجو را با استفاده از یک کادر مستطیل سیاه روی متن جستجو شده سیاه می کنیم.

برای اطلاعات بیشتر در مورد API، به مستندات مراجعه کنید. برای سؤالات، از طریق [فروم 18 با ما تماس بگیرید.

همچنین ببینید