Tekstverwerkingsdocumenten zijn aanwezig op bijna elk apparaat in deze digitale wereld. Evenzo begon bijna elke tekstverwerker het markdown-formaat te ondersteunen. De voortdurende toename van MD-bestanden terwijl de webpagina’s de transformatie van Word-inhoud naar websites met behulp van het markdown-formaat vergroten. Dit artikel bespreekt hoe u Word-documenten programmatisch converteert naar markdown-bestanden met behulp van C#.
.NET API om Markdown-bestanden te parseren en te converteren
GroupDocs demonstreert zijn .NET API die het ontleden en converteren van Word-documenten naar andere formaten binnen de .NET-applicaties mogelijk maakt. We zullen zijn GroupDocs.Parser for .NET gebruiken voor het ontleden en transformeren van Word DOC/DOCX-bestanden in MD-bestanden. Bovendien ondersteunt de API het parseren van vele andere bestandsindelingen, zoals pdf’s, spreadsheets, presentaties, eBooks, opmaakdocumenten, e-mailindelingen, archieven, afbeeldingen en vele andere die worden genoemd in de documentatie.
U kunt de DLL’s of het MSI-installatieprogramma downloaden van de downloadsectie of de API in uw .NET-toepassing installeren via NuGet.
PM> Install-Package GroupDocs.Parser
Hoe Word naar Markdown te converteren met C#
Laten we snel naar het doel gaan en het Microsoft Word-document omzetten in een markdown-indeling. De volgende stappen laten zien hoe u de Word DOC/DOCX converteert naar Markdown met behulp van C#.
- Laad het MS Word-bestand met behulp van de klasse Parser.
- Haal de opgemaakte tekst van het geladen bestand op met behulp van de klasse FormattedTextOptions en de Markdown-modus.
- Lees de volledige inhoud met behulp van de ReadToEnd-methode.
- Converteer het naar Markdown door de inhoud naar een MD-bestand te schrijven met de schrijfmethode van de klasse TextWriter.
De volgende C#-broncode converteert het MS Word docx-bestand naar Markdown-indeling.
using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
{
string content = reader.ReadToEnd();
using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
{
textWriter.Write(content);
}
}
}
Ontvang een gratis API-licentie
U kunt een gratis tijdelijke licentie krijgen om de API te gebruiken zonder de evaluatiebeperkingen.
Conclusie
Kortom, we hebben geleerd om Word-bestanden te converteren naar markdown-formaat met behulp van C# binnen onze .NET-applicaties. U kunt deze functie binnen uw toepassing gebruiken. U kunt uw toepassing uitbreiden door andere beschikbare functies van de API te gebruiken.
Leer meer over de .NET Parser API met behulp van de bijbehorende documentatie en door de voorbeelden te ervaren die beschikbaar zijn op GitHub. Neem voor vragen contact met ons op via het forum.