Java'da Word Belgesini Markdown'a Dönüştür

İşaretleme dosyalarının kelime işlem editörleri tarafından desteklenmesi, kullanımını büyük ölçüde artırdı. Bu nedenle, mevcut metin içeriğinin indirim formatına dönüştürülmesi sıklıkla talep edilir. Bu makalede, Word belgelerinin program aracılığıyla Java’da işaretleme dosyalarına nasıl dönüştürüleceği anlatılmaktadır. Son zamanlarda, aşağıdaki ilgili konulardan bazılarını tartıştık:

Markdown Dosyalarını Ayrıştırmak ve Dönüştürmek için Java API

GroupDocs, Word belgesinin ayrıştırılmasına ve uygulamalar içinde diğer biçimlere dönüştürülmesine izin veren API’ler sağlar. Word DOC/DOCX dosyalarını ayrıştırmak ve MD dosyalarına dönüştürmek için Java API kullanacağız. Ayrıca API, PDF’ler, elektronik tablolar, sunumlar, e-Kitaplar, biçimlendirme belgeleri, e-posta mesajları, resimler ve belgelerde belirtilen diğer birçok dosya biçimini ayrıştırmayı destekler.

JAR dosyasını indirilenler bölümünden indirebilir veya Maven tabanlı Java uygulamalarınızda en son depo ve bağımlılık yapılandırmalarını kullanabilirsiniz.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Java’da Word’ü Markdown’a Dönüştürme

Neden doğrudan ilgilendiğiniz konuya geçip Microsoft Word belgesini indirim formatına dönüştürelim? Aşağıdaki adımlar, Word DOC/DOCX’in Java’da Markdown’a nasıl dönüştürüleceğini göstermektedir.

  • Parser sınıfını kullanarak MS Word dosyasını yükleyin.
  • FormattedTextOptions sınıfını ve Markdown modunu kullanarak yüklenen dosyanın biçimlendirilmiş metnini alın.
  • readToEnd yöntemini kullanarak tüm içeriği okuyun.
  • FileWriter sınıfının yazma yöntemini kullanarak içeriği bir MD dosyasına yazarak işaretleme biçimine dönüştürün.

Aşağıdaki Java kaynak kodu, MS Word’ü bir Markdown dosyasına dönüştürür.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Ücretsiz API Lisansı Alın

Değerlendirme sınırlamaları olmadan API’yi kullanmak için ücretsiz geçici lisans alabilirsiniz.

Çözüm

Özetlemek gerekirse, Java’da Word dosyalarını uygulamalar içinde markdown formatına dönüştürmeyi öğrendik. Bu özelliği uygulamanızda kullanabilirsiniz. API’nin mevcut diğer özelliklerini kullanarak uygulamanızı genişletebilirsiniz.

Belgelerini kullanarak ve GitHub’ta bulunan örnekleri deneyerek Java Ayrıştırıcı API’si hakkında daha fazla bilgi edinin. Herhangi bir sorunuz için forum aracılığıyla bize ulaşın.

Ayrıca bakınız