การแทนที่ข้อความในเอกสารทางธุรกิจนั้นเป็นงานที่พบได้บ่อย บทความนี้อธิบาย วิธีการค้นหาและแทนที่เนื้อหาในเอกสาร PDF โดยใช้ AI และ C# คุณจะได้เรียนรู้วิธีการใช้การลบข้อมูลแบบกำหนดเองและบูรณาการ AI เพื่อปรับปรุงเนื้อหา PDF
หัวข้อดังต่อไปนี้ถูกรวมอยู่ในบทความนี้:
- วิธีปกติในการแทนที่ข้อความ
- ขั้นตอนการลบ PDF โดยใช้เครื่องมือ AI ผ่าน C#
- โค้ด C# ที่ใช้ฟังก์ชัน GroupDocs.Redaction
- โค้ด C# สำหรับการลบข้อมูลแบบกำหนดเอง
- ตัวอย่างคำสั่ง AI
ฟีเจอร์ GroupDocs.Redaction สำหรับการแทนที่ข้อความ
GroupDocs.Redaction ช่วยให้คุณสามารถแทนที่ข้อความในรูปแบบไฟล์ที่รองรับได้หลายรูปแบบ วิธีนี้อิงจากการใช้ Regular expression เพื่อระบุข้อความที่จำเป็นต้องแทนที่ อย่างไรก็ตาม การทำงานกับ Regular expression อาจต้องการความพยายามเพิ่มเติม โดยเฉพาะในสถานการณ์ที่ซับซ้อนมากขึ้น สำหรับข้อมูลเพิ่มเติม โปรดดูที่ เอกสารของเรา.
ขั้นตอนการลบ PDF โดยใช้เครื่องมือ AI ผ่าน C#
คุณสามารถใช้ฟีเจอร์นี้เพื่อซ่อนข้อมูลที่ละเอียดอ่อน หรือสร้างเอกสารที่กำหนดเองจากเทมเพลต ขั้นตอนด้านล่างจะแสดงวิธีใช้ AI เพื่อแทนที่ข้อความเฉพาะในเอกสาร PDF ภายในแอปพลิเคชัน .NET
- โหลด ไฟล์ PDF โดยใช้คลาส Redactor.
- จัดเตรียมตัวจัดการการลบข้อมูลแบบกำหนดเอง โดยการนำเสนอ logic AI ของคุณผ่านทางอินเตอร์เฟส ICustomRedactionHandler.
- ประมวลผลข้อความในเอกสาร โดยใช้ PageAreaRedaction ร่วมกับ ReplacementOptions.
- ใช้การลบข้อมูล โดยใช้เมธอด Apply().
- บันทึก เอกสารที่ประมวลผลไปยังตำแหน่งใหม่โดยใช้เมธอด Save().
โค้ด C# ที่ใช้ฟังก์ชัน GroupDocs.Redaction
โค้ดด้านล่างนี้ใช้ AI เพื่อค้นหาและแทนที่หมายเลขบัตรเครดิตในเอกสาร โค้ดนี้ประกอบด้วยเมธอดหลักที่เริ่มต้นการทำงานของ Redactor และใช้การลบข้อมูลโดยการเรียกใช้เมธอด Apply().
public async Task Redaction_Custom_AI()
{
// ปกติแล้ว regex นี้ใช้เพื่อตรวจหาข้อความสำหรับการแทนที่
// เพื่อมอบข้อความทั้งหมดที่เป็นไปได้สำหรับการลบข้อมูลแบบกำหนดเอง ใช้ regex เช่นในตัวอย่าง
Regex regex = new Regex(".*");
// กำหนดหน้าเป้าหมายและข้อความที่แทนที่สำหรับการลบข้อมูล
ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
optionsText.Filters = new RedactionFilter[] {
new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
};
// จัดเตรียมการดำเนินการของตัวจัดการการลบข้อมูลแบบกำหนดเอง
optionsText.CustomRedaction = new TextRedactor() { Test = this };
var textRedaction = new PageAreaRedaction(regex, optionsText);
var redactions = new Redaction[] { textRedaction };
// ประมวลผลเอกสาร
using (var redactor = new Redactor("source.pdf"))
{
// ใช้การลบข้อมูลกับเอกสาร
RedactorChangeLog result = redactor.Apply(redactions);
if (result.Status != RedactionStatus.Failed)
{
redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
}
}
}
โค้ด C# สำหรับการลบข้อมูลแบบกำหนดเอง
การนำเข้า ICustomRedactionHandler ช่วยให้ผู้ใช้สามารถกำหนด logic ของตนเองในการลบย่อหน้าข้อความในไฟล์ PDF การใช้คลาสดังกล่าวจะช่วยให้สามารถสร้างอัลกอริธึมที่ยืดหยุ่นซึ่งปรับแต่งตามความต้องการเฉพาะของธุรกิจ
public class TextRedactor : ICustomRedactionHandler
{
public Redaction_Custom Test { get; set; }
public CustomRedactionResult Redact(CustomRedactionContext context)
{
CustomRedactionResult result = new CustomRedactionResult();
if (!String.IsNullOrEmpty(context.Text))
{
var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
if (response.Result != "none")
{
result.Apply = true;
result.Text = response.Result;
}
}
return result;
}
}
ตัวอย่างคำสั่ง AI
ส่วนสุดท้ายคือโค้ดการบูรณาการ AI คำสั่งที่ให้มานั้นค่อนข้างซับซ้อน เนื่องจากไม่เครื่องมือ AI ทุกชนิดสามารถประมวลผลข้อมูลที่ละเอียดอ่อน เช่น หมายเลขบัตรเครดิต
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
string prompt =
"เฮ้ ฉันมีเอกสารชิ้นหนึ่งที่นี่ " +
"คุณช่วยฉันแทนที่ส่วนที่ดูเหมือนกับบล็อกดิจิทัล เช่น 'XXXX-' ได้ไหม? " +
"บล็อกเหล่านี้เป็นเพียงตัวเลขและขีดกลาง " +
"แต่ละรายการที่ฉันต้องการแทนที่อาจมีบล็อกเหล่านี้ตั้งแต่หนึ่งถึงสี่บล็อก " +
$"โปรดแทนที่บล็อกทั้งหมดด้วย '{replacement}' ในข้อความ " +
"ฉันไม่ต้องการความคิดเห็นใด ๆ จากคุณ " +
"ส่งคืนเฉพาะข้อความที่มีรายการที่แทนที่หรือแค่คำว่า 'none' หากไม่มีอะไรที่จะแทนที่ " +
$"นี่คือข้อความที่จะทำงานด้วย \n\n {text}";
// รหัสการบูรณาการ AI ของผู้ใช้ ซึ่งขึ้นอยู่กับเครื่องมือ AI ที่ใช้
return await RequestToAI(prompt);
}
ผลลัพธ์ของโค้ดด้านบนมีดังนี้:
สรุป
ในบทความนี้ เราได้เรียนรู้วิธีการใช้การลบข้อมูลแบบกำหนดเองและการบูรณาการ AI เพื่อประมวลผล PDF เครื่องมือ AI สามารถทำให้การประมวลผลข้อความง่ายขึ้นมาก แต่บางครั้งอาจใช้เวลามากขึ้นและไม่คาดเดาได้เมื่อเปรียบเทียบกับเครื่องมือปกติ
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับผลิตภัณฑ์ของเรา โปรดไปที่ เอกสาร. หากคุณมีข้อสงสัย โปรดติดต่อเราผ่าน ฟอรั่ม.
ลองใช้แอปเว็บฟรีของเรา
สำรวจความสามารถของ GroupDocs.Redaction โดยใช้ แอปพลิเคชันเว็บออนไลน์. ทดสอบฟีเจอร์หลักได้โดยตรงในเบราว์เซอร์ของคุณโดยไม่ต้องติดตั้งอะไร