Come programmatori, abbiamo spesso la necessità di ottenere il testo estratto da vari tipi di documenti. In precedenza abbiamo discusso del conteggio delle parole nei documenti, dell’estrazione di archivi ZIP, dell’estrazione di immagini da eBook e dell’analisi dei campi dei moduli PDF. Oggi, in questo articolo, imparerai come analizzare ed estrarre il testo dai file Markdown usando C#.

Estrai il testo dai file MD usando C#.jpg

API .NET per l’estrazione di testo Markdown

GroupDocs fornisce la sua API .NET per analizzare documenti ed estrarre testo da vari formati di documento all’interno delle applicazioni .NET. In questo articolo, useremo il suo GroupDocs.Parser for .NET per estrarre il testo dai file MD usando C#.

Inoltre, l’API supporta l’analisi di molti altri formati di file come documenti di elaborazione testi (DOC, DOCX, …), fogli di calcolo (XLS, XLSX, …), presentazioni (PPT, PPTX, …), eBook (EPUB, FB2, …) , immagini di codici a barre (JPG, PNG, …) e molti altri citati nella sua documentazione.

Puoi scaricare le DLL o il programma di installazione MSI dalla sezione download o installare l’API nella tua applicazione .NET tramite NuGet.

PM> Install-Package GroupDocs.Parser

Estrai testo dal file Markdown in C#

Di seguito sono riportati i passaggi per estrarre l’intero contenuto del testo dal file markdown utilizzando C#.

  • Carica il file MD usando la classe Parser.
  • Estrarre l’intero testo in TextReader utilizzando il metodo GetText.
  • Usa il testo come desideri.

Il codice sorgente C# seguente estrae il contenuto testuale del file MD.

// Estrai l'intero file di testo di Markdown
using (Parser parser = new Parser("/path/document.md"))
{
    using (TextReader reader = parser.GetText())
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

Ottieni una licenza API gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare l’API senza i limiti di valutazione.

Conclusione

Per riassumere, abbiamo discusso di come estrarre il testo dai file markdown in C# con un esempio. Questo potrebbe averti guidato a sviluppare la tua estrazione di testo o un’applicazione per l’analisi dei documenti come Online Document Parser sviluppato da GroupDocs.

Puoi saperne di più sull’API .NET di analisi del documento usando la sua documentazione. Il modo migliore per imparare è provare gli esempi disponibili su GitHub. Contattaci per qualsiasi domanda tramite il forum.

Guarda anche