Splits PDF in meerdere bestanden met behulp van C#

PDF is een van de meest gebruikte bestandsindelingen die zeer draagbaar is. Als ontwikkelaar bent u mogelijk geconfronteerd met het scenario om grote PDF-bestanden programmatisch te splitsen. In een van de artikelen hebben we geleerd om de pdf-bestanden in Java te splitsen. Vandaag bespreekt dit artikel verschillende manieren om PDF-bestanden te splitsen met C# in .NET-toepassingen.

.NET API om PDF-bestanden te splitsen

Om PDF-bestanden te splitsen, gebruiken we GroupDocs.Merger for .NET. Het is de API die snelle ontwikkeling mogelijk maakt om functies met zeer weinig regels code te integreren. Naast splitsen ondersteunt het het samenvoegen, verwisselen of inkorten van documenten van verschillende bestandsindelingen.

U kunt de DLL’s of het MSI-installatieprogramma downloaden van de downloadsectie of de API in uw .NET-toepassing installeren via NuGet.

PM> Install-Package GroupDocs.Merger

Splits een PDF-bestand in bestanden met meerdere pagina’s met behulp van C#

De volgende stappen laten zien hoe u PDF-bestanden kunt splitsen in bestanden met meerdere pagina’s met behulp van C#:

  • Definieer het formaat van het uitvoerbestand(en).
  • Definieer de pagina-intervallen met SplitOptions.
  • Laad het PDF-bestand met de klasse Merger.
  • Splits de geladen PDF volgens het gedefinieerde interval met de methode Split().

Het volgende codevoorbeeld laat zien hoe u PDF-bestanden splitst in bestanden met meerdere pagina’s.

/*
 * Splits PDF-bestanden in bestanden met meerdere pagina's met C#
 */
// Definieer uitvoerbestand(en) formaat
string filePathOut = "path/splitPDF_{0}.{1}";

// Definieer splitsingsintervallen en splitsingsmodus
SplitOptions splitOptions = new SplitOptions(filePathOut, new int[] { 3, 6, 8 }, SplitMode.Interval);

// Laad het PDF-bestand en splits PDF volgens splitsopties
using (Merger merger = new Merger("path/document.pdf"))
{
    merger.Split(splitOptions);
} 

Extraheer pagina’s uit PDF-bestanden op bereik

De volgende stappen helpen u bij het extraheren van pagina’s uit PDF met behulp van C# door te splitsen volgens het gegeven bereik:

  • Definieer het formaat van het uitvoerbestand(en).
  • Geef het paginabereik op met SplitOptions.
  • Laad het PDF-bestand met de klasse Merger.
  • Gebruik de methode Split() om de geladen PDF te splitsen volgens het gedefinieerde bereik.

Het volgende codefragment laat zien hoe u PDF kunt splitsen en pagina’s kunt extraheren door het bereik op te geven.

/*
 * Splits een PDF-bestand op gegeven bereik in bestanden met één pagina met behulp van C#
 */
// Definieer uitvoerbestand(en) formaat
string filePathOut = "path/splitPDF_{0}.{1}";

// Definieer het bereik dat moet worden geëxtraheerd als documenten met één pagina
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 7);

// Laad het PDF-bestand en splits PDF volgens splitsopties
using (Merger merger = new Merger("path/document.pdf"))
{
    merger.Split(splitOptions);
}

Extraheer even/oneven pagina’s uit PDF-bestanden met C#

De volgende stappen begeleiden hoe u even/oneven pagina’s uit een PDF-bestand kunt extraheren door binnen het gegeven bereik te splitsen door alleen filters toe te passen in C#:

  • Definieer het formaat van het uitvoerbestand(en).
  • Geef het paginabereik op met SplitOptions.
  • Pas het filter toe voor even, oneven of alle pagina’s met behulp van RangeMode.
  • Laad het PDF-bestand met de klasse Merger.
  • Gebruik de methode Split() om de geladen PDF te scheiden volgens het gedefinieerde filter.

Het volgende codefragment laat zien hoe alle oneven/even pagina’s in het gedefinieerde bereik van een PDF-bestand kunnen worden geëxtraheerd.

/*
 * PDF-bestand splitsen op gegeven bereik en filteren (even/oneven pagina's) in bestanden met één pagina met behulp van C#
 */
// Definieer uitvoerbestand(en) formaat
string filePathOut = "path/splitPDF_{0}.{1}";

// Definieer bereik en filter om alle ODD-pagina's in het opgegeven bereik te extraheren als documenten met één pagina
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 7, RangeMode.OddPages);

// Laad het PDF-bestand en splits PDF volgens splitsopties
using (Merger merger = new Merger("path/document.pdf"))
{
    merger.Split(splitOptions);
}

Splits een PDF-bestand op in meerdere bestanden van één pagina

De volgende stappen laten zien hoe we een PDF kunnen splitsen om pagina’s te extraheren als meerdere bestanden van één pagina in C#:

  • Definieer het formaat van het uitvoerbestand(en).
  • Definieer de exacte paginanummers met behulp van SplitOptions.
  • Laad het PDF-bestand met de klasse Merger.
  • Splits de geladen PDF op basis van gedefinieerde pagina’s met de methode Split().

Het volgende codevoorbeeld laat zien hoe u PDF-bestanden splitst in meerdere bestanden van één pagina.

/*
 * Splits een PDF-bestand op in Single Page-bestanden met behulp van C#
 */
// Definieer uitvoerbestand(en) formaat
string filePathOut = "path/splitPDF_{0}.{1}";

// Definieer pagina's die moeten worden geëxtraheerd als document met één pagina
SplitOptions splitOptions = new SplitOptions(filePathOut, new int[] { 3, 6, 8 });

// Laad het PDF-bestand en splits PDF volgens splitsopties
using (Merger merger = new Merger("path/document.pdf"))
{
    merger.Split(splitOptions);
}

Samenvatting codewijziging

In alle scenario’s is het ding dat verandert de manier om SplitOptions te definiëren. Hier is de samenvatting van de wijziging in elk codefragment voor elk scenario. U kunt de volgende instellingen gebruiken volgens uw vereisten binnen uw code. Hier gebruikte ik een PDF-bestand met 10 pagina’s.

  • Voor bestanden met meerdere pagina’s - Gebruik Interval: [1,2], [3,4,5], [6,7], [8,9,10].
new SplitOptions(outputFile,  new int[] { 3, 6, 8 }, SplitMode.Interval)
  • Pagina’s extraheren in bereik: [3], [4], [5], [6]
new SplitOptions(outputFile, 3, 6);
  • Bereik met filter: [3], [5], [7]
new SplitOptions(outputFile, 3, 8, (Integer)RangeMode.OddPages);
  • Afzonderlijke pagina’s: [3], [4], [9]
new SplitOptions(outputFile, new int[] { 3, 4, 9 });

Ontvang een gratis API-licentie

U kunt een gratis tijdelijke licentie krijgen om de API te gebruiken zonder de evaluatiebeperkingen.

Conclusie

Tot slot hebben we de manieren besproken om PDF-bestanden te splitsen met C#. Eerst splitsen we het PDF-bestand op in documenten met meerdere pagina’s en documenten met één pagina. We hebben ook pagina’s uit PDF-bestanden gehaald. Eerst hebben we alle pagina’s geëxtraheerd en vervolgens de even/oneven pagina’s binnen het opgegeven bereik. U kunt proberen uw eigen .NET-app voor het splitsen van PDF’s te bouwen met behulp van de GroupDocs.Merger API.

Ga voor meer informatie over de API naar de documentatie. Neem voor vragen contact met ons op via het forum.

Zie ook