I documenti di elaborazione testi sono presenti in quasi tutti i dispositivi in questo mondo digitale. Allo stesso modo, quasi tutti gli editor di elaborazione testi hanno iniziato a supportare il formato markdown. Il continuo aumento dei file MD mentre le pagine Web aumentano la trasformazione del contenuto di Word in siti Web utilizzando il formato markdown. Questo articolo illustra come convertire a livello di codice documenti di Word in file markdown usando C#.

Converti documento Word in Markdown in C#

API .NET per analizzare e convertire file Markdown

GroupDocs mostra la sua API .NET che consente l’analisi e la conversione di documenti Word in altri formati all’interno delle applicazioni .NET. Useremo il suo GroupDocs.Parser for .NET per l’analisi e la trasformazione di file Word DOC/DOCX in file MD. Inoltre, l’API supporta l’analisi di molti altri formati di file come PDF, fogli di calcolo, presentazioni, eBook, documenti di markup, formati e-mail, archivi, immagini e molti altri menzionati nella documentazione.

Puoi scaricare le DLL o il programma di installazione MSI dalla sezione download o installare l’API nella tua applicazione .NET tramite NuGet.

PM> Install-Package GroupDocs.Parser

Come convertire Word in Markdown usando C#

Passiamo rapidamente all’obiettivo e trasformiamo il documento Microsoft Word in formato markdown. I passaggi seguenti mostrano come convertire Word DOC/DOCX in Markdown usando C#.

  • Carica il file MS Word usando la classe Parser.
  • Ottieni il testo formattato del file caricato usando la classe FormattedTextOptions e la modalità Markdown.
  • Leggi il contenuto completo usando il metodo ReadToEnd.
  • Convertilo in Markdown scrivendo il contenuto in un file MD usando il metodo Write della classe TextWriter.

Il seguente codice sorgente C# converte il file docx di MS Word nel formato Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Ottieni una licenza API gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare l’API senza i limiti di valutazione.

Conclusione

Per riassumere, abbiamo imparato a convertire i file di Word in formato markdown usando C# all’interno delle nostre applicazioni .NET. Puoi utilizzare questa funzione all’interno della tua applicazione. Puoi estendere la tua applicazione utilizzando altre funzionalità disponibili dell’API.

Scopri di più sull’API Parser .NET usando la sua documentazione e sperimentando gli esempi disponibili su GitHub. Contattaci per qualsiasi domanda tramite il forum.

Guarda anche