Les données des fichiers CSV sont essentiellement des valeurs séparées par des virgules et il est très difficile de lire ces données au format brut. Cependant, lorsque ces fichiers sont visualisés à l’aide de l’un des éditeurs bien connus tels que Microsoft Excel, OpenOffice Calc ou LibreOffice qui prennent en charge le format CSV, il devient assez facile de manipuler les fichiers CSV. Même dans ce cas, qu’en est-il si vous souhaitez comparer deux gros fichiers CSV pour leur différence de données ? Faisons-le par programmation. Cet article couvre rapidement la méthode de base pour comparer deux fichiers CSV en Java.

API Java pour comparer les fichiers CSV

GroupDocs présente ses API qui permettent de comparer deux ou plusieurs fichiers CSV pour les différences au sein des applications. J’utiliserai son API Java, c’est-à-dire GroupDocs.Comparison for Java pour comparer les fichiers CSV.

L’API prend également en charge la comparaison de plus de deux fichiers CSV, la comparaison de fichiers CSV protégés par mot de passe, l’acceptation et le rejet des modifications découvertes, et bien plus encore.

Télécharger et configurer

Obtenez la bibliothèque de comparaison CSV à partir de la section téléchargements. Pour les applications Java basées sur Maven, ajoutez la configuration suivante dans pom.xml. Plus tard, vous pourrez essayer les exemples de cet article ainsi que de nombreux autres de GitHub. Pour plus de détails, vous pouvez également consulter la API Reference.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

Comment comparer des fichiers CSV en Java

Directement au sujet, faisons la comparaison de base. C’est aussi simple que n’importe quelle application de comparaison CSV en ligne. Chargez simplement le fichier de comparaison, puis appuyez sur comparer. Voici les fichiers qui sont comparés ci-dessous :

Fichiers CSV à comparer

Voici les étapes pour comparer deux fichiers CSV pour les différences en Java :

  • Chargez le premier fichier CSV à l’aide de la classe Comparer.
  • Ajoutez le deuxième fichier CSV à l’aide de la méthode d’ajout correspondante.
  • Comparez les deux fichiers à l’aide de la méthode de comparaison.

Le code Java suivant compare les fichiers CSV et fournit les différences dans une sortie CSV.

// Comparez CSV (fichiers séparés par des virgules) en utilisant Java

Comparer comparer = new Comparer("path/comma-separated-file-1.csv");
comparer.add("path/comma-separated-file-2.csv");
final Path outputFilePath = comparer.compare("path/comparison-result.csv");

Le résultat de sortie est le suivant :

Résultat de la comparaison des fichiers CSV

Conclusion

Pour résumer, nous venons d’apprendre à comparer deux fichiers CSV de valeurs séparées par des virgules dans une application Java. Dans le résumé de la comparaison, nous obtenons également le nombre de différences trouvées dans les fichiers comparés. Cette fonctionnalité vous permet de trouver les dissemblances entre deux gros fichiers CSV. De même, vous pouvez créer votre propre application Java de comparaison de fichiers CSV à l’aide de cette fonctionnalité simple.

Pour plus de détails et pour en savoir plus sur l’API, consultez sa documentation. Pour toute question, contactez-nous via le forum.

Voir également