Gegevens in CSV-bestanden zijn in feite door komma’s gescheiden waarden en het is erg moeilijk om dergelijke gegevens in onbewerkt formaat te lezen. Wanneer deze bestanden echter worden bekeken met een van de bekende editors zoals Microsoft Excel, OpenOffice Calc of LibreOffice die CSV-indeling ondersteunen, wordt het vrij eenvoudig om CSV-bestanden te manipuleren. Zelfs dan, hoe zit het als u twee grote CSV-bestanden wilt vergelijken op hun verschil in gegevens? Laten we het programmatisch doen. Dit artikel behandelt snel de basismanier om twee CSV-bestanden in Java te vergelijken.
Java API voor het vergelijken van CSV-bestanden
GroupDocs demonstreert zijn API’s waarmee twee of meer CSV-bestanden kunnen worden vergeleken op verschillen binnen de applicaties. Ik zal de Java API, dwz GroupDocs.Comparison for Java, gebruiken om CSV-bestanden te vergelijken.
De API ondersteunt ook de vergelijking van meer dan twee CSV-bestanden, het vergelijken van met een wachtwoord beveiligde CSV-bestanden, het accepteren en weigeren van de ontdekte wijzigingen, en nog veel meer.
Downloaden en configureren
Download de CSV-vergelijkingsbibliotheek uit het gedeelte downloads. Voeg voor op Maven gebaseerde Java-toepassingen de volgende configuratie toe binnen pom.xml. Later kunt u de voorbeelden van dit artikel proberen, evenals nog veel meer van GitHub. Voor meer informatie kunt u ook de API-referentie bezoeken.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-comparison</artifactId>
<version>22.3</version>
</dependency>
Hoe CSV-bestanden in Java te vergelijken
Meteen naar het onderwerp, laten we de basisvergelijking doen. Het is net zo eenvoudig als elke online CSV-vergelijkingstoepassing. Laad gewoon het vergelijkingsbestand en klik op vergelijken. De volgende zijn de bestanden die hieronder worden vergeleken:
Hieronder volgen de stappen om twee CSV-bestanden te vergelijken op verschillen in Java:
- Laad het eerste CSV-bestand met de klasse Comparer.
- Voeg het tweede CSV-bestand toe met behulp van de respectievelijke toevoegmethode.
- Vergelijk beide bestanden met behulp van de vergelijkingsmethode.
De volgende Java-code vergelijkt de CSV-bestanden en biedt de verschillen in een CSV-uitvoer.
// Vergelijk CSV (Comma Separated Files) met Java
Comparer comparer = new Comparer("path/comma-separated-file-1.csv");
comparer.add("path/comma-separated-file-2.csv");
final Path outputFilePath = comparer.compare("path/comparison-result.csv");
Het uitvoerresultaat is als volgt:
Conclusie
Kortom, we hebben zojuist geleerd om twee CSV-bestanden met door komma’s gescheiden waarden te vergelijken binnen een Java-toepassing. In de samenvatting van de vergelijking krijgen we ook het aantal gevonden verschillen binnen de vergeleken bestanden. Met deze functie kunt u de verschillen tussen twee grote CSV-bestanden vinden. Op dezelfde manier kunt u met deze eenvoudige functie uw eigen Java-toepassing voor het vergelijken van CSV-bestanden bouwen.
Ga voor meer details en voor meer informatie over de API naar de documentatie. Neem voor vragen contact met ons op via het forum.