PDF เป็นรูปแบบไฟล์ที่ใช้ในการนำเสนอเอกสารในลักษณะที่ไม่ขึ้นกับแอพพลิเคชั่นซอฟต์แวร์ ฮาร์ดแวร์ และระบบปฏิบัติการที่ใช้ในการสร้างหรือดู อย่างไรก็ตาม PDF ไม่สามารถแก้ไขได้ง่ายและไม่เหมาะสำหรับหน้าเว็บ การแปลงไฟล์ PDF เป็น HTML ทำให้สามารถแก้ไข ค้นหา และจัดทำดัชนีเนื้อหาของเอกสารโดยเสิร์ชเอ็นจิ้นได้ง่าย และช่วยให้ดูเอกสารบนเว็บได้ง่ายขึ้น ในบทความนี้ เราจะเรียนรู้วิธีแปลงเอกสาร PDF เป็นรูปแบบ PDF โดยใช้ C#

แปลง PDF เป็น HTML ใน CSharp

.NET API เพื่อแปลงไฟล์ PDF เป็น HTML

GroupDocs มอบโซลูชันการแปลงเอกสารเพื่อเพิ่มประสิทธิภาพให้กับนักพัฒนาด้วยระบบอัตโนมัติ ช่วยโปรแกรมเมอร์ในการแปลงเอกสารและรูปแบบรูปภาพต่างๆ ด้วย .NET API ที่มีประสิทธิภาพและเชื่อถือได้ วันนี้ ฉันจะใช้ GroupDocs.Conversion for .NET API เพื่อแปลงเอกสาร PDF เป็นรูปแบบ HTML

คุณสามารถดาวน์โหลดโปรแกรมติดตั้ง DLLs หรือ MSI ได้จาก ส่วนการดาวน์โหลด หรือติดตั้ง API ในแอปพลิเคชัน .NET ของคุณผ่านทาง NuGet

PM> Install-Package GroupDocs.Conversion

วิธีแปลง PDF เป็น HTML โดยใช้ C#

เรามาเริ่มกันที่การแปลงไฟล์ PDF เป็นรูปแบบ HTML พื้นฐานโดยใช้ C# ขั้นตอนต่อไปนี้แปลงหน้าทั้งหมดของไฟล์ PDF เป็น HTML

  • โหลดไฟล์ PDF โดยใช้คลาส Converter
  • เรียกใช้เมธอด Convert เพื่อแปลงเอกสารที่โหลดเป็นรูปแบบ PDF

รหัส C# ต่อไปนี้แปลงเอกสาร PDF ทั้งหมดเป็น HTML

using GroupDocs.Conversion.Options.Convert;
...

// แปลง PDF เป็น HTML โดยใช้ C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

แปลงหน้าที่เลือกของเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านโดยใช้ C#

คุณยังสามารถแปลงเอกสาร PDF ที่มีการป้องกันหรือล็อค ขั้นตอนต่อไปนี้แสดงวิธีแปลงหน้าที่เลือกของเอกสาร PDF ที่ถูกล็อกเป็นรูปแบบ HTML โดยใช้ C#

  • เตรียมตัวเลือกการโหลดโดยใช้คลาส PdfLoadOptions
  • ตอนนี้ โหลดไฟล์ PDF โดยใช้คลาส Converter
  • เตรียมตัวเลือกการแปลงสำหรับรูปแบบ HTML โดยใช้คลาส WebConvertOptions
  • กำหนดรายการหน้าตัวเลือกการแปลงโดยใช้ Pages, PageNumber, PageCount, Zoom และคุณสมบัติอื่นๆ
  • สุดท้าย ใช้เมธอด Convert เพื่อแปลงไฟล์ PDF ที่โหลดเป็นรูปแบบ HTML

รหัส C# ต่อไปนี้จะแปลงหน้าที่เลือกของเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML

// แปลงหน้าที่เลือกของ PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML โดยใช้ C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // เตรียมตัวเลือกการแปลง
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
เอาต์พุต PDF เป็น HTML

บทสรุป

เพื่อสรุปบทความ เราได้กล่าวถึงการแปลง PDF เป็น HTML โดยใช้ C# เราใช้การแปลงสองรายการแยกกัน ขั้นแรก เราแปลงเอกสารทั้งหมดโดยใช้ตัวเลือกการแปลงเริ่มต้น นอกจากนี้ เราแปลงหน้าที่เลือกของเอกสารที่ป้องกันด้วยรหัสผ่านเป็น HTML โดยใช้ .NET API เดียวกัน

คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ .NET Conversion Automation API ได้โดยใช้ documentation, API Reference หรือโดยการสัมผัส GitHub Examples คุณสามารถติดต่อเราเพื่อสอบถามผ่าน ฟอรัม

ดูสิ่งนี้ด้วย