Nous avons récemment discuté de comment obtenir tous les synonymes de n’importe quel mot. Ce serait merveilleux si nous pouvions localiser ces synonymes dans de nombreux documents différents. Dans cet article, nous verrons comment rechercher n’importe quel mot et ses synonymes dans plusieurs fichiers en utilisant Java.

Voici les sujets abordés ci-dessous :

API Java - Rechercher des synonymes dans plusieurs fichiers

GroupDocs.Search présente l’API Java GroupDocs.Search for Java. Il permet de rechercher des mots et leurs synonymes dans divers fichiers multiples du dossier spécifié. Il prend en charge une longue liste de formats de fichiers différents et diverses techniques de recherche. Certaines de ces fonctionnalités sont mentionnées ci-dessous et vous pouvez les utiliser en combinaison pour atteindre votre cible :

  • Recherche booléenne
  • Recherche sensible à la casse
  • Mettez en surbrillance les résultats de la recherche
  • Recherche d’homophones
  • Recherche de phrases
  • Recherche d’expressions régulières
  • Recherche par morceaux
  • Recherche de synonymes

Télécharger ou configurer

Vous pouvez télécharger le fichier JAR à partir de la section téléchargements, ou simplement obtenir les dernières configurations de référentiel et de dépendances pour le pom.xml de vos applications Java basées sur maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>21.8</version> 
</dependency>

Trouver des synonymes dans plusieurs fichiers à l’aide de Java

Passons rapidement à la recherche de synonymes dans les fichiers. Les étapes suivantes montrent comment rechercher des synonymes (mots ayant des significations similaires) dans les fichiers d’un dossier à l’aide de Java :

  • Définissez le dossier d’index, le dossier du document et la requête (le mot à rechercher).
  • Créez un index à l’aide d’un dossier d’index défini à l’aide de la classe Index.
  • Ajouter le dossier des documents à l’index.
  • Activez la recherche de synonymes à l’aide de SearchOptions.
  • Appelez la méthode search de la classe Index et passez la requête avec les options de recherche.
  • Imprimez le résumé en utilisant les propriétés de la classe SearchResult récupérée.

Le code source suivant montre comment trouver tous les synonymes dans les fichiers à l’aide de Java :

// Rechercher des synonymes dans plusieurs fichiers et dossiers à l'aide de Java
String indexFolder = "path/indexFolder";
String documentsFolder = "path/documentsFolder";
String query = "make";

// Création d'un index dans le dossier spécifié
Index index = new Index(indexFolder);
index.add(documentsFolder);

// Création d'un objet d'options de recherche
SearchOptions options = new SearchOptions();
options.setUseSynonymSearch(true); // Enable Synonym Search

// Rechercher le mot "faire"
// En plus du mot 'make', les synonymes 'do, get, have, ...' seront également recherchés
SearchResult result = index.search(query, options);

System.out.println("Query: " + query);
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Word & Synonym Occurrences: " + result.getOccurrenceCount());

Voici la sortie du code ci-dessus :

Query: **make**
Documents: 3
Word & Synonym Occurrences: 44 

À partir des résultats de la recherche obtenus à l’étape ci-dessus, vous pouvez obtenir les informations concernant chaque mot et synonyme de la recherche. Les étapes suivantes présentent les résultats en détail après avoir obtenu tous les synonymes et leur nombre d’occurrences dans chaque document :

  • Tout d’abord, effectuez la recherche pour obtenir le SearchResult.
  • Traversez le résultat de la recherche pour travailler avec chaque FoundDocument.
  • Imprimer les propriétés respectives de chaque FoundDocument.
  • Maintenant, extrayez puis parcourez le FoundDocumentField dans chaque FoundDocument.
  • Chaque FoundDocumentField contient ses propres termes, occurrences et autres propriétés. Utilisez le getter correspondant.

Le code source suivant affiche le résultat de la recherche de synonymes ainsi que le nombre d’occurrences de chaque terme recherché en Java.

// Impression des résultats de la recherche de synonymes en Java
System.out.println("Query: " + query);
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Word & Synonym Occurrences: " + result.getOccurrenceCount());

for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences: " + document.getOccurrenceCount());

  for (FoundDocumentField field : document.getFoundFields()) {
        System.out.println("\tField: " + field.getFieldName());
        System.out.println("\tOccurrences: " + document.getOccurrenceCount());
  
        // Impression des termes trouvés
        if (field.getTerms() != null) {
            for (int k = 0; k < field.getTerms().length; k++) {
                System.out.println("\t\t" + field.getTerms()[k] + "\t - \t" + field.getTermsOccurrences()[k]);
            }
        }
    }
}

Voici la sortie du code ci-dessus :

Query: **make**
Documents: 2
Total occurrences: 22

Document: C:/documents/sample.docx
Occurrences: 13
    Field: content
    Occurrences: 13
        **make**  -  2
        **have**  -  1
        **get**  -  2
        **do**  -  8
- - - - - - - - - - - - - - - - 
Document: C:/documents/sample.txt
Occurrences: 11
    Field: content
    Occurrences: 11
        **make**  -  1
        **have**  -  2
        **get**  -  1
        **do**  -  7
- - - - - - - - - - - - - - - - 
Document: C:/documents/sample.pdf
Occurrences: 20
    Field: content
    Occurrences: 20
        **make**  -  2
        **have**  -  2
        **get**  -  2
        **do**  -  14 

Synonymes de recherche et résultats d’impression en Java - Code complet

Combinons les deux étapes ci-dessus, voici donc le code source complet. Tout d’abord, il trouve tous les synonymes selon la requête fournie. Ensuite, il imprime toutes les occurrences de chaque synonyme dans chaque document en Java.

// Rechercher des synonymes dans plusieurs fichiers et dossiers à l'aide de Java
String indexFolder = "path/indexFolder";
String documentsFolder = "path/documentsFolder";
String query = "make";

// Création d'un index dans le dossier spécifié
Index index = new Index(indexFolder);
index.add(documentsFolder);

// Création d'un objet d'options de recherche
SearchOptions options = new SearchOptions();
options.setUseSynonymSearch(true); // Enable Synonym Search

// Rechercher le mot "faire"
// En plus du mot 'make', les synonymes 'do, get, have, ...' seront également recherchés
SearchResult result = index.search(query, options);

System.out.println("Query: " + query);
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Word & Synonym Occurrences: " + result.getOccurrenceCount());

for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences: " + document.getOccurrenceCount());

  for (FoundDocumentField field : document.getFoundFields()) {
        System.out.println("\tField: " + field.getFieldName());
        System.out.println("\tOccurrences: " + document.getOccurrenceCount());
  
        // Impression des termes trouvés
        if (field.getTerms() != null) {
            for (int k = 0; k < field.getTerms().length; k++) {
                System.out.println("\t\t" + field.getTerms()[k] + "\t - \t" + field.getTermsOccurrences()[k]);
            }
        }
    }
}

Obtenez une licence API gratuite

Vous pouvez obtenir une licence temporaire gratuite afin d’utiliser l’API sans les limitations d’évaluation.

Conclusion

Pour résumer, nous avons expliqué comment rechercher un mot avec son synonyme dans plusieurs documents à l’aide de Java. Plus important encore, vous pouvez maintenant essayer de développer votre propre application Java pour la recherche, tout comme GroupDocs.Search App.

En savoir plus sur l’API Java Search Automation dans la documentation. Pour découvrir les fonctionnalités, essayez des exemples du référentiel GitHub. N’hésitez pas à nous contacter pour toute question via le forum.

Voir également