CSV-Dateidaten sind im Grunde kommagetrennte Werte und es ist sehr schwierig, solche Daten im Rohformat zu lesen. Wenn diese Dateien jedoch mit einem der bekannten Editoren wie Microsoft Excel, OpenOffice Calc oder LibreOffice angezeigt werden, die das CSV-Format unterstützen, wird es ziemlich einfach, CSV-Dateien zu manipulieren. Was ist selbst dann, wenn Sie zwei große CSV-Dateien auf ihre unterschiedlichen Daten vergleichen möchten? Machen wir es programmgesteuert. Dieser Artikel behandelt schnell die grundlegende Methode zum Vergleichen von zwei CSV-Dateien in Java.
Java-API zum Vergleichen von CSV-Dateien
GroupDocs präsentiert seine APIs, die es ermöglichen, zwei oder mehr CSV-Dateien auf Unterschiede innerhalb der Anwendungen zu vergleichen. Ich werde die Java-API verwenden, dh GroupDocs.Comparison for Java, um CSV-Dateien zu vergleichen.
Die API unterstützt auch den Vergleich von mehr als zwei CSV-Dateien, den Vergleich passwortgeschützter CSV-Dateien, das Akzeptieren und Ablehnen der entdeckten Änderungen und vieles mehr.
Herunterladen und konfigurieren
Holen Sie sich die CSV-Vergleichsbibliothek aus dem Abschnitt Downloads. Fügen Sie für Maven-basierte Java-Anwendungen die folgende Konfiguration in pom.xml hinzu. Später können Sie die Beispiele dieses Artikels sowie viele weitere von GitHub ausprobieren. Einzelheiten finden Sie auch in der API-Referenz.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-comparison</artifactId>
<version>22.3</version>
</dependency>
So vergleichen Sie CSV-Dateien in Java
Kommen wir direkt zum Thema, machen wir den grundlegenden Vergleich. Es ist so einfach wie jede Online-CSV-Vergleichsanwendung. Laden Sie einfach die Vergleichsdatei und klicken Sie dann auf Vergleichen. Im Folgenden sind die Dateien aufgeführt, die unten verglichen werden:
Im Folgenden sind die Schritte zum Vergleichen von zwei CSV-Dateien auf Unterschiede in Java aufgeführt:
- Laden Sie die erste CSV-Datei mit der Klasse Comparer.
- Fügen Sie die zweite CSV-Datei mit der entsprechenden Add-Methode hinzu.
- Vergleichen Sie beide Dateien mit der Vergleichsmethode.
Der folgende Java-Code vergleicht die CSV-Dateien und stellt die Unterschiede in einer CSV-Ausgabe bereit.
// Vergleichen Sie CSV (Comma Separated Files) mit Java
Comparer comparer = new Comparer("path/comma-separated-file-1.csv");
comparer.add("path/comma-separated-file-2.csv");
final Path outputFilePath = comparer.compare("path/comparison-result.csv");
Das Ausgabeergebnis sieht wie folgt aus:
Fazit
Zusammenfassend haben wir gerade gelernt, zwei CSV-Dateien mit kommagetrennten Werten in einer Java-Anwendung zu vergleichen. In der Zusammenfassung des Vergleichs erhalten wir auch die Anzahl der Unterschiede, die in den verglichenen Dateien gefunden wurden. Mit dieser Funktion können Sie die Unterschiede zwischen zwei großen CSV-Dateien finden. In ähnlicher Weise können Sie mit dieser einfachen Funktion Ihre eigene Java-Anwendung zum Vergleich von CSV-Dateien erstellen.
Weitere Einzelheiten und Informationen zur API finden Sie in der zugehörigen Dokumentation. Bei Fragen kontaktieren Sie uns über das Forum.