PDF เป็นรูปแบบไฟล์ที่ใช้ในการนำเสนอเอกสารในลักษณะที่ไม่ขึ้นกับแอพพลิเคชั่นซอฟต์แวร์ ฮาร์ดแวร์ และระบบปฏิบัติการที่ใช้ในการสร้างหรือดู อย่างไรก็ตาม PDF ไม่สามารถแก้ไขได้ง่ายและไม่เหมาะสำหรับหน้าเว็บ การแปลงไฟล์ PDF เป็น HTML ทำให้สามารถแก้ไข ค้นหา และจัดทำดัชนีเนื้อหาของเอกสารโดยเสิร์ชเอ็นจิ้นได้ง่าย และช่วยให้ดูเอกสารบนเว็บได้ง่ายขึ้น ในบทความนี้ เราจะเรียนรู้วิธีแปลงเอกสาร PDF เป็นรูปแบบ PDF โดยใช้ C#
.NET API เพื่อแปลงไฟล์ PDF เป็น HTML
GroupDocs มอบโซลูชันการแปลงเอกสารเพื่อเพิ่มประสิทธิภาพให้กับนักพัฒนาด้วยระบบอัตโนมัติ ช่วยโปรแกรมเมอร์ในการแปลงเอกสารและรูปแบบรูปภาพต่างๆ ด้วย .NET API ที่มีประสิทธิภาพและเชื่อถือได้ วันนี้ ฉันจะใช้ GroupDocs.Conversion for .NET API เพื่อแปลงเอกสาร PDF เป็นรูปแบบ HTML
คุณสามารถดาวน์โหลดโปรแกรมติดตั้ง DLLs หรือ MSI ได้จาก ส่วนการดาวน์โหลด หรือติดตั้ง API ในแอปพลิเคชัน .NET ของคุณผ่านทาง NuGet
PM> Install-Package GroupDocs.Conversion
วิธีแปลง PDF เป็น HTML โดยใช้ C#
เรามาเริ่มกันที่การแปลงไฟล์ PDF เป็นรูปแบบ HTML พื้นฐานโดยใช้ C# ขั้นตอนต่อไปนี้แปลงหน้าทั้งหมดของไฟล์ PDF เป็น HTML
- โหลดไฟล์ PDF โดยใช้คลาส Converter
- เรียกใช้เมธอด Convert เพื่อแปลงเอกสารที่โหลดเป็นรูปแบบ PDF
รหัส C# ต่อไปนี้แปลงเอกสาร PDF ทั้งหมดเป็น HTML
using GroupDocs.Conversion.Options.Convert;
...
// แปลง PDF เป็น HTML โดยใช้ C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
var options = new WebConvertOptions();
converter.Convert("path/converted-pdf-to.html", options);
}
แปลงหน้าที่เลือกของเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านโดยใช้ C#
คุณยังสามารถแปลงเอกสาร PDF ที่มีการป้องกันหรือล็อค ขั้นตอนต่อไปนี้แสดงวิธีแปลงหน้าที่เลือกของเอกสาร PDF ที่ถูกล็อกเป็นรูปแบบ HTML โดยใช้ C#
- เตรียมตัวเลือกการโหลดโดยใช้คลาส PdfLoadOptions
- ตอนนี้ โหลดไฟล์ PDF โดยใช้คลาส Converter
- เตรียมตัวเลือกการแปลงสำหรับรูปแบบ HTML โดยใช้คลาส WebConvertOptions
- กำหนดรายการหน้าตัวเลือกการแปลงโดยใช้ Pages, PageNumber, PageCount, Zoom และคุณสมบัติอื่นๆ
- สุดท้าย ใช้เมธอด Convert เพื่อแปลงไฟล์ PDF ที่โหลดเป็นรูปแบบ HTML
รหัส C# ต่อไปนี้จะแปลงหน้าที่เลือกของเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML
// แปลงหน้าที่เลือกของ PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML โดยใช้ C#
using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...
Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
Password = "file-password_123"
};
using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
// เตรียมตัวเลือกการแปลง
WebConvertOptions options = new WebConvertOptions
{
PageNumber = 2,
FixedLayout = true,
PagesCount = 1,
FixedLayoutShowBorders = false
};
converter.Convert("path/converted-adv-pdf-to-.html", options);
}
บทสรุป
เพื่อสรุปบทความ เราได้กล่าวถึงการแปลง PDF เป็น HTML โดยใช้ C# เราใช้การแปลงสองรายการแยกกัน ขั้นแรก เราแปลงเอกสารทั้งหมดโดยใช้ตัวเลือกการแปลงเริ่มต้น นอกจากนี้ เราแปลงหน้าที่เลือกของเอกสารที่ป้องกันด้วยรหัสผ่านเป็น HTML โดยใช้ .NET API เดียวกัน
คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ .NET Conversion Automation API ได้โดยใช้ documentation, API Reference หรือโดยการสัมผัส GitHub Examples คุณสามารถติดต่อเราเพื่อสอบถามผ่าน ฟอรัม