PDF הוא פורמט קובץ המשמש להצגת מסמכים באופן שאינו תלוי בתוכנת היישום, החומרה ומערכת ההפעלה המשמשים ליצירתם או הצפייה בהם. עם זאת, קובצי PDF אינם ניתנים לעריכה בקלות ואינם מתאימים היטב לדפי אינטרנט. המרת PDF ל-HTML מאפשרת עריכה, חיפוש והוספה של תוכן המסמך בקלות על ידי מנועי החיפוש, ומאפשרת צפייה קלה יותר במסמך באינטרנט. במאמר זה נלמד כיצד להמיר מסמכי PDF לפורמט PDF באמצעות C#.

המר PDF ל-HTML ב-CSharp.

.NET API להמרת קבצי PDF ל-HTML

GroupDocs מספקת פתרון להמרת מסמכים כדי להעצים מפתחים עם אוטומציה. זה עוזר למתכנתים בהמרה של מסמכים ופורמטים שונים של תמונות עם ה-.NET API היעיל והאמין שלו. היום, אני אשתמש ב-GroupDocs.Conversion for .NET API שלו כדי להמיר מסמכי PDF לפורמט HTML.

אתה יכול להוריד את קובצי ה-DLL או ה-MSI מתקין מסעיף ההורדות או להתקין את ה-API באפליקציית NET שלך דרך NuGet.

PM> Install-Package GroupDocs.Conversion

כיצד להמיר PDF ל-HTML באמצעות C#

נתחיל בהמרה בסיסית של קובץ PDF לפורמט HTML באמצעות C#. השלבים הבאים הופכים את כל הדפים של קובץ PDF ל-HTML.

  • טען את קובץ ה-PDF באמצעות המחלקה Converter.
  • התקשר לשיטת Convert כדי להפוך את המסמך הנטען לפורמט PDF.

קוד C# הבא ממיר את כל מסמך ה-PDF ל-HTML.

using GroupDocs.Conversion.Options.Convert;
...

// המרת PDF ל-HTML באמצעות C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

המר דפים נבחרים של מסמכי PDF מוגנים באמצעות סיסמה באמצעות C#

אתה יכול גם להמיר מסמכי PDF מוגנים או נעולים. השלבים הבאים מראים כיצד להמיר דפים סלקטיביים של מסמך PDF נעול לפורמט HTML באמצעות C#.

  • הכן את אפשרויות הטעינה באמצעות המחלקה PdfLoadOptions.
  • כעת, טען את קובץ ה-PDF באמצעות המחלקה Converter.
  • הכן את אפשרויות ההמרה עבור פורמט HTML באמצעות המחלקה WebConvertOptions.
  • הגדר את רשימת הדפים המועמדים להמרה באמצעות Pages, PageNumber, Page Count, Zoom ומאפיינים אחרים.
  • לבסוף, השתמש בשיטת המר כדי להפוך את קובץ ה-PDF הנטען לפורמט HTML.

קוד C# הבא ממיר את הדפים הנבחרים של מסמך ה-PDF המוגן בסיסמה ל-HTML.

// המר דפים נבחרים של PDF מוגן בסיסמה ל-HTML באמצעות C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // הכן אפשרויות המרה
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
פלט PDF ל-HTML

סיכום

לסיום המאמר, דנו בהמרת PDF ל-HTML באמצעות C#. יישמנו בנפרד שתי המרות שונות. ראשית, המרנו את כל המסמך באמצעות אפשרויות ההמרה המוגדרות כברירת מחדל. יתר על כן, המרנו את הדפים הנבחרים של מסמך מוגן בסיסמה ל-HTML באמצעות אותו NET API.

אתה יכול ללמוד עוד על ה-.NET Conversion Automation API באמצעות תיעוד, API Reference, או על ידי התנסות ב-GitHub דוגמאות. ניתן להגיע אלינו לכל שאלה דרך הפורום.

ראה גם