İşaretleme dosyalarının kelime işlem editörleri tarafından desteklenmesi, kullanımını büyük ölçüde artırdı. Bu nedenle, mevcut metin içeriğinin indirim formatına dönüştürülmesi sıklıkla talep edilir. Bu makalede, Word belgelerinin program aracılığıyla Java’da işaretleme dosyalarına nasıl dönüştürüleceği anlatılmaktadır. Son zamanlarda, aşağıdaki ilgili konulardan bazılarını tartıştık:
- C# kullanarak Word’ü Markdown’a dönüştürün
- Java’daki Markdown Dosyalarından Metin Çıkarın
- Markdown Dosyalarını PDF Java’ya Dönüştürün
Markdown Dosyalarını Ayrıştırmak ve Dönüştürmek için Java API
GroupDocs, Word belgesinin ayrıştırılmasına ve uygulamalar içinde diğer biçimlere dönüştürülmesine izin veren API’ler sağlar. Word DOC/DOCX dosyalarını ayrıştırmak ve MD dosyalarına dönüştürmek için Java API kullanacağız. Ayrıca API, PDF’ler, elektronik tablolar, sunumlar, e-Kitaplar, biçimlendirme belgeleri, e-posta mesajları, resimler ve belgelerde belirtilen diğer birçok dosya biçimini ayrıştırmayı destekler.
JAR dosyasını indirilenler bölümünden indirebilir veya Maven tabanlı Java uygulamalarınızda en son depo ve bağımlılık yapılandırmalarını kullanabilirsiniz.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
Java’da Word’ü Markdown’a Dönüştürme
Neden doğrudan ilgilendiğiniz konuya geçip Microsoft Word belgesini indirim formatına dönüştürelim? Aşağıdaki adımlar, Word DOC/DOCX’in Java’da Markdown’a nasıl dönüştürüleceğini göstermektedir.
- Parser sınıfını kullanarak MS Word dosyasını yükleyin.
- FormattedTextOptions sınıfını ve Markdown modunu kullanarak yüklenen dosyanın biçimlendirilmiş metnini alın.
- readToEnd yöntemini kullanarak tüm içeriği okuyun.
- FileWriter sınıfının yazma yöntemini kullanarak içeriği bir MD dosyasına yazarak işaretleme biçimine dönüştürün.
Aşağıdaki Java kaynak kodu, MS Word’ü bir Markdown dosyasına dönüştürür.
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
Ücretsiz API Lisansı Alın
Değerlendirme sınırlamaları olmadan API’yi kullanmak için ücretsiz geçici lisans alabilirsiniz.
Çözüm
Özetlemek gerekirse, Java’da Word dosyalarını uygulamalar içinde markdown formatına dönüştürmeyi öğrendik. Bu özelliği uygulamanızda kullanabilirsiniz. API’nin mevcut diğer özelliklerini kullanarak uygulamanızı genişletebilirsiniz.
Belgelerini kullanarak ve GitHub’ta bulunan örnekleri deneyerek Java Ayrıştırıcı API’si hakkında daha fazla bilgi edinin. Herhangi bir sorunuz için forum aracılığıyla bize ulaşın.