ניקוי והקטנת HTML משפרים את זמן הטעינה ואת השימוש ברוחב הפס של דפי האינטרנט. יש לציין שקוד מיותר מוזרק כאשר מסמך אחד מומר לפורמט HTML באמצעות כלים מסוימים. אתה יכול להיפטר מהקוד הלא רצוי הזה בתוך יישומי ה-.NET שלך. מאמר זה דן כיצד לעבד מסמכי Word ל-HTML ממוזער באמצעות C#.

עיבוד Word כ-HTML נקי באמצעות C#

.NET API לעיבוד כ-HTML ממוזער

GroupDocs.Viewer מספק ממשק API לצפייה במסמכים המאפשר עיבוד מסמכים שונים ל-HTML, PDF ופורמטים של תמונה בתוך יישום NET. אני אשתמש ב-API הזה בדוגמאות כדי להמיר את קובץ ה-DOCX לקובץ HTML נקי.

אתה יכול להוריד את קובצי ה-DLL או ההתקנה של MSI מקטע ההורדות או להתקין את ה-API באפליקציית NET שלך דרך [NuGet](https://www.nuget .org/packages/groupdocs.viewer).

PM> Install-Package GroupDocs.Viewer

עיבוד Word DOC/DOCX ל-HTML ממוזער באמצעות C#

ניתן להשיג קבצי HTML באמצעות משאבים מוטבעים או חיצוניים באמצעות שיטות מתאימות. השלבים הבאים מראים כיצד להמיר את מסמך Word (DOC/DOCX) ל-HTML ממוזער באמצעות C#.

  • טען את קובץ ה-DOCX באמצעות המחלקה Viewer.
  • הכן את אפשרויות עיבוד ה-HTML באמצעות המחלקה HtmlViewOptions.
  • הפעל את האפשרות Minify על ידי הגדרתה כ-true.
  • השתמש ב-View() עם אפשרויות שנוצרו כדי להציג את קובץ DOCX כ-HTML ממוזער.

הדוגמה הבאה של קוד C# מעבדת את קובץ ה- DOCX של Word ל-HTML ממוזער.

// המר את Word DOC/DOCX ל-HTML ממוזער באמצעות C#
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

קבל רישיון API בחינם

אתה יכול להשתמש בממשקי ה-API בחינם ללא מגבלות הערכה על ידי קבלת רישיון זמני.

סיכום

לסיכום, דנו כיצד לעבד את קובצי DOC/DOCX כ-HTML ממוזער באמצעות C#. אתה יכול לבנות ממיר ומנקה מקוונים משלך המאפשר למשתמשים להמיר את המסמכים ל-HTML ממוזער. חוץ מזה, תוכל ללמוד עוד על GroupDocs.Viewer for .NET מהתיעוד.לשאלות, צור איתנו קשר דרך הפורום.

ראה גם