کتاب الکترونیکی که عموماً به عنوان کتاب الکترونیکی شناخته می شود، کتابی به شکل دیجیتال است که در دستگاه های الکترونیکی مختلف قابل خواندن است. این دستگاهها شامل eReaders اختصاصی مانند Kindle، یا لپتاپ، رایانههای رومیزی و تلفنهای هوشمند هستند. بسیاری از فرمت های فایل محبوب کتاب های الکترونیکی در حال استفاده در بازار وجود دارد که عبارتند از: EPUB، FictionBook FB2، Microsoft Compiled HTML Help - CHM، DjVu، MOBI، PDF، و بسیاری دیگر. به عنوان یک برنامه نویس، این مقاله به شما کمک می کند تا به صورت برنامه نویسی تصاویر را از کتاب های الکترونیکی در C# در برنامه های NET استخراج کنید.
موضوعات زیر در زیر پوشش داده خواهد شد:
- NET API برای استخراج تصویر از کتابهای الکترونیکی
- استخراج تصاویر از کتاب الکترونیکی EPUB در سی شارپ
- استخراج تصاویر از کتاب های الکترونیکی FB2، CHM در سی شارپ
NET API برای استخراج تصویر از کتابهای الکترونیکی
برای استخراج تصاویر از کتابهای الکترونیکی، از GroupDocs.Parser for .NET API در نمونههای C# این مقاله استفاده خواهم کرد. همراه با کتابهای الکترونیکی، این API از تجزیه و استخراج تصاویر از اسناد پردازش کلمه، صفحات گسترده، PDF، ارائهها، ایمیلها، بایگانیهای ZIP و بسیاری از قالبهای سند دیگر پشتیبانی میکند.
میتوانید نصبکننده DLL یا MSI را از بخش دانلودها دانلود کنید یا از طریق NuGet API را در برنامه داتنت خود نصب کنید.
PM> Install-Package GroupDocs.Parser
استخراج تصاویر از کتاب الکترونیکی EPUB در C#
بیایید با کتاب الکترونیکی EPUB شروع کنیم تا آن را برای تصاویر تجزیه کنیم. مراحل زیر به دنبال کد سی شارپ، کتاب الکترونیکی EPUB را تجزیه و تمام تصاویر موجود در آن را استخراج می کند.
- شیء کلاس Parser ایجاد کنید.
- از روش GetImages برای استخراج تمام تصاویر کتاب الکترونیکی EPUB استفاده کنید.
- تصاویر استخراج شده را برای ذخیره یکی یکی پیمایش کنید.
کد C# زیر مراحل تجزیه ذکر شده را برای تجزیه به کتاب الکترونیکی EPUB نشان داده شده در بالا پیاده سازی می کند و تصاویر استخراج شده را یک به یک در دیسک ذخیره می کند.
// کتابهای الکترونیکی را برای استخراج تصاویر از فایل EPUB، FB2، CHM تجزیه کنید و در C# در دیسک ذخیره کنید.
using (Parser parser = new Parser("ebook.epub"))
{
// استخراج تصاویر از کتاب الکترونیکی
IEnumerable<PageImageArea> images = parser.GetImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// تکرار روی تصاویر استخراج شده
foreach (PageImageArea image in images)
{
image.Save(("Image-" + imageNumber.ToString() + image.FileType.Extension), options);
imageNumber++;
}
}
در نتیجه، تمام تصاویر موجود ذخیره خواهند شد. در اینجا یکی از تصاویر نشان داده شده به عنوان نمونه است.
می توانید تصاویر استخراج شده را در هر یک از فرمت های فایل تصویری پشتیبانی شده زیر ذخیره کنید:
- JPG
- PNG
- WEBP
- GIF
- BMP
استخراج تصاویر از کتاب های الکترونیکی FB2، CHM در C#
اگر کتاب الکترونیکی را با فرمت FB2، CHM یا با فرمت دیگری دارید، می توانید تصاویر آن را به همین روش استخراج کنید. شما فقط باید کتاب الکترونیکی خود را در حین ایجاد شیء به سازنده Parser ارسال کنید. سپس متد GetImages با استفاده از همان کد سی شارپ، تصاویر را از هر یک از کتاب های الکترونیکی ارائه شده استخراج می کند.
// Pass the FB2, CHM, PDF, or any other eBook to Parser contructor
Parser parser = new Parser("ebook.fb2"); // FB2
// Parser parser = new Parser("ebook.chm"); // CHM
// Parser parser = new Parser("ebook.pdf"); // PDF
IEnumerable<PageImageArea> images = parser.GetImages();
نتیجه
امیدوارم اکنون در دریافت برنامهنویسی همه تصاویر از کتابهای الکترونیکی با فرمتهای فایل EPUB، FB2، CHM و سایر فرمتهای فایل در برنامههای NET خود راحت باشید. شما حتی می توانید برنامه استخراج تصویر خود را با استفاده از GroupDocs.Parser for .NET API بسازید.
برای اطلاعات بیشتر در مورد API، میتوانید از اسناد یا نمونههای منبع باز در GitHub دیدن کنید. برای هر گونه مشکل بیشتر، می توانید با پشتیبانی سریع در [فروم 15 تماس بگیرید.