Tài liệu soạn thảo văn bản hiện diện trong hầu hết mọi thiết bị trong thế giới kỹ thuật số này. Tương tự như vậy, hầu hết mọi trình soạn thảo văn bản đều bắt đầu hỗ trợ định dạng đánh dấu. Sự gia tăng liên tục của các tệp MD khi các trang web làm tăng việc chuyển đổi nội dung Word thành các trang web sử dụng định dạng đánh dấu. Bài viết này thảo luận về cách lập trình chuyển đổi tài liệu Word thành tệp đánh dấu bằng C#.

Chuyển đổi tài liệu Word thành Markdown trong C#

.NET API để phân tích cú pháp và chuyển đổi tệp Markdown

GroupDocs giới thiệu .NET API cho phép phân tích cú pháp và chuyển đổi tài liệu Word sang các định dạng khác trong các ứng dụng .NET. Chúng tôi sẽ sử dụng GroupDocs.Parser for .NET để phân tích cú pháp và chuyển đổi tệp Word DOC/DOCX thành tệp MD. Ngoài ra, API hỗ trợ phân tích cú pháp nhiều định dạng tệp khác như PDF, bảng tính, bản trình bày, sách điện tử, tài liệu đánh dấu, định dạng email, tài liệu lưu trữ, hình ảnh và nhiều định dạng khác được đề cập trong tài liệu.

Bạn có thể tải xuống trình cài đặt DLL hoặc MSI từ phần tải xuống hoặc cài đặt API trong ứng dụng .NET của bạn qua NuGet.

PM> Install-Package GroupDocs.Parser

Cách chuyển đổi Word sang Markdown bằng C#

Hãy nhanh chóng chuyển sang mục tiêu và chuyển đổi tài liệu Microsoft Word sang định dạng markdown. Các bước sau đây cho thấy cách chuyển đổi Word DOC/DOCX sang Markdown bằng C#.

  • Tải tệp MS Word bằng lớp Parser.
  • Nhận văn bản được định dạng của tệp đã tải bằng cách sử dụng lớp FormattedTextOptions và chế độ Markdown.
  • Đọc toàn bộ nội dung bằng phương thức ReadToEnd.
  • Chuyển đổi nó thành Markdown bằng cách ghi nội dung vào tệp MD bằng phương thức Viết của lớp TextWriter.

Mã nguồn C# sau chuyển đổi tệp docx MS Word sang định dạng Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Nhận giấy phép API miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng API mà không bị giới hạn đánh giá.

Sự kết luận

Tóm lại, chúng tôi đã học cách chuyển đổi các tệp Word sang định dạng markdown bằng C# trong các ứng dụng .NET của mình. Bạn có thể sử dụng tính năng này trong ứng dụng của mình. Bạn có thể mở rộng ứng dụng của mình bằng cách sử dụng các tính năng có sẵn khác của API.

Tìm hiểu thêm về .NET Parser API bằng cách sử dụng tài liệu của nó và bằng cách trải nghiệm các ví dụ có sẵn trên GitHub. Liên hệ với chúng tôi nếu có bất kỳ thắc mắc nào qua diễn đàn.

Xem thêm