PDF, belgeleri oluşturmak veya görüntülemek için kullanılan uygulama yazılımı, donanım ve işletim sisteminden bağımsız bir şekilde sunmak için kullanılan bir dosya biçimidir. Ancak, PDF’ler kolayca düzenlenemez ve web sayfaları için pek uygun değildir. PDF’yi HTML’ye dönüştürmek, belge içeriğinin arama motorları tarafından kolayca düzenlenmesini, aranmasını ve dizine eklenmesini sağlar ve belgenin web’de daha kolay görüntülenmesini sağlar. Bu yazıda, C# kullanarak PDF belgelerini PDF formatına nasıl dönüştüreceğimizi öğreneceğiz.
PDF Dosyalarını HTML’ye Dönüştürmek için .NET API
GroupDocs, geliştiricileri otomasyonla güçlendirmek için bir belge dönüştürme çözümü sunar. Verimli ve güvenilir .NET API’si ile programcılara çeşitli belgeleri ve görüntü formatlarını dönüştürmede yardımcı olur. Bugün, PDF belgelerini HTML formatına dönüştürmek için GroupDocs.Conversion for .NET API’sini kullanacağım.
İndirilenler bölümünden DLL’leri veya MSI yükleyicisini indirebilir veya NuGet aracılığıyla .NET uygulamanıza API’yi yükleyebilirsiniz.
PM> Install-Package GroupDocs.Conversion
C# kullanarak PDF’yi HTML’ye Dönüştürme
C# kullanarak bir PDF dosyasının temel olarak HTML biçimine dönüştürülmesiyle başlayalım. Aşağıdaki adımlar, bir PDF dosyasının tüm sayfalarını HTML’ye dönüştürür.
- Converter sınıfını kullanarak PDF dosyasını yükleyin.
- Yüklenen belgeyi PDF biçimine dönüştürmek için Convert yöntemini çağırın.
Aşağıdaki C# kodu, tüm PDF belgesini HTML’ye dönüştürür.
using GroupDocs.Conversion.Options.Convert;
...
// C# kullanarak PDF'yi HTML'ye dönüştürün
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
var options = new WebConvertOptions();
converter.Convert("path/converted-pdf-to.html", options);
}
Parola Korumalı PDF Belgelerinin Seçilen Sayfalarını C# Kullanarak Dönüştürün
Korumalı veya kilitli PDF belgelerini de dönüştürebilirsiniz. Aşağıdaki adımlar, kilitli bir PDF belgesinin seçili sayfalarının C# kullanarak HTML biçimine nasıl dönüştürüleceğini gösterir.
- PdfLoadOptions sınıfını kullanarak yükleme seçeneklerini hazırlayın.
- Şimdi, Converter sınıfını kullanarak PDF dosyasını yükleyin.
- WebConvertOptions sınıfını kullanarak HTML biçimi için dönüştürme seçeneklerini hazırlayın.
- Pages, PageNumber, PageCount, Zoom ve diğer özellikleri kullanarak dönüşüm aday sayfalarının listesini tanımlayın.
- Son olarak, yüklenen PDF dosyasını HTML formatına dönüştürmek için Convert yöntemini kullanın.
Aşağıdaki C# kodu, parola korumalı PDF belgesinin seçili sayfalarını HTML’ye dönüştürür.
// Parola korumalı PDF'nin seçili sayfalarını C# kullanarak HTML'ye dönüştürün
using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...
Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
Password = "file-password_123"
};
using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
// Dönüştürme seçeneklerini hazırlayın
WebConvertOptions options = new WebConvertOptions
{
PageNumber = 2,
FixedLayout = true,
PagesCount = 1,
FixedLayoutShowBorders = false
};
converter.Convert("path/converted-adv-pdf-to-.html", options);
}
Çözüm
Makaleyi bitirmek için, C# kullanarak PDF’den HTML’ye dönüştürmeyi tartıştık. İki farklı dönüşümü ayrı ayrı uyguladık. İlk olarak, tüm belgeyi varsayılan dönüştürme seçeneklerini kullanarak dönüştürdük. Ayrıca, parola korumalı bir belgenin seçili sayfalarını aynı .NET API’sini kullanarak HTML’ye dönüştürdük.
Belgeleri, API Referansı’nı kullanarak veya GitHub örneklerini deneyimleyerek .NET Conversion Automation API hakkında daha fazla bilgi edinebilirsiniz. Herhangi bir sorunuz için forum aracılığıyla bize ulaşabilirsiniz.