Recherche inversée d'images dans des documents

Qu’est-ce que la recherche d’image inversée ?

La recherche d’image inversée est une technologie qui permet aux utilisateurs de rechercher des informations en utilisant une image comme requête de recherche au lieu de texte. Contrairement aux recherches traditionnelles basées sur des mots-clés, la recherche d’image inversée traite le contenu visuel pour trouver des correspondances, récupérer des métadonnées ou fournir un contexte sur l’image.

Cette méthode est devenue indispensable pour des tâches telles que l’identification de l’origine d’une image, la vérification de son authenticité, la découverte de contenu similaire et la détection d’une utilisation non autorisée de matériel protégé par des droits d’auteur. La recherche d’image inversée est largement utilisée dans divers domaines, y compris le commerce électronique, le journalisme, la criminalistique numérique, et plus encore.

Comment fonctionne la recherche d’image inversée ?

Au cœur de la recherche d’images inversée se trouve une technologie clé appelée hachage perceptuel. Cette approche génère une empreinte unique pour chaque image, qui est ensuite comparée aux empreintes d’autres images pour identifier les similitudes. Voici comment le hachage perceptuel fonctionne dans la recherche d’images inversée :

Prétraitement de l’image : Avant de générer un hachage, l’image est prétraitée pour éliminer les détails inutiles et standardiser son format. Cela implique généralement de redimensionner l’image à une taille fixe plus petite et de la convertir en niveaux de gris. Cela garantit que le processus de hachage est cohérent sur toutes les images.
Extraction de caractéristiques : Au lieu d’analyser chaque pixel individuel, le hachage perceptuel se concentre sur des caractéristiques de haut niveau de l’image, telles que sa structure globale, ses motifs et sa distribution des couleurs. Ces caractéristiques sont résumées dans une représentation plus petite qui capture l’essence de l’image tout en ignorant les variations mineures comme les artefacts de compression ou un léger recadrage.
Génération du hachage : Un hachage est une chaîne de longueur fixe ou une séquence binaire qui représente les caractéristiques de l’image. Les hachages perceptuels sont spécialement conçus pour garantir que les images visuellement similaires produisent des hachages presque identiques, même si les images ont été légèrement modifiées (par exemple, redimensionnées, pivotées ou comprimées).
Comparer les hachages : Une fois le hachage de l’image de requête généré, il est comparé aux hachages stockés dans une base de données. Cette comparaison utilise des techniques comme la distance de Hamming, qui mesure le nombre de bits différents entre deux hachages. Une différence plus petite indique une plus grande similitude entre les images.

En se concentrant sur les caractéristiques perceptuelles, cette méthode permet aux moteurs de recherche d’images inversées de faire correspondre non seulement des images identiques, mais aussi celles qui ont subi de légères modifications. Le hachage perceptuel est une approche légère et efficace qui rend la recherche d’images inversées pratique même pour des ensembles de données à grande échelle.

Implémentation de la recherche d’images inversée avec l’API GroupDocs.Search

L’API GroupDocs.Search offre une solution polyvalente et efficace pour mettre en œuvre des fonctionnalités de recherche d’images inversées dans vos applications. Grâce à ses fonctionnalités d’indexation et de recherche d’images, vous pouvez créer un système pour localiser des images stockées dans des documents ou des fichiers autonomes. Voici un guide étape par étape pour configurer la recherche d’images inversées en utilisant l’API GroupDocs.Search.

Étape 1 : Configurer l’environnement

Pour commencer, incluez la bibliothèque GroupDocs.Search dans votre projet. Vous pouvez le faire en installant la bibliothèque via NuGet pour les projets .NET. Exécutez simplement la commande suivante dans la Console du Gestionnaire de packages :

Install-Package GroupDocs.Search

Étape 2 : Indexation des images

Pour activer la recherche d’images inversée, vous devez indexer les images de vos dossiers de documents. GroupDocs.Search vous permet d’indexer des images autonomes (par exemple, .png, .jpg) ainsi que des images intégrées dans des fichiers de documents ou des formats de conteneurs comme .zip. Voici un exemple de la façon de créer un index et d’ajouter des documents pour l’indexation d’images :

string indexFolder = @"C:\MyIndex";
string documentFolder = @"C:\MyDocuments";

// Creating an index
Index index = new Index(indexFolder);

// Setting the image indexing options
IndexingOptions indexingOptions = new IndexingOptions();
indexingOptions.ImageIndexingOptions.EnabledForContainerItemImages = true;
indexingOptions.ImageIndexingOptions.EnabledForEmbeddedImages = true;
indexingOptions.ImageIndexingOptions.EnabledForSeparateImages = true;

// Indexing documents in a document folder
index.Add(documentFolder, indexingOptions);

Ici, les options ImageIndexingOptions sont activées pour garantir que toutes les images (qu’elles soient autonomes, intégrées ou provenant de conteneurs) sont indexées. Cela rend la recherche d’image inversée complète.

Étape 3 : Recherche d’images connexes

Une fois les images indexées, vous pouvez rechercher des images similaires en fournissant une image de référence comme requête. Personnalisez la recherche avec ImageSearchOptions pour contrôler des aspects comme le niveau de similarité acceptable (HashDifferences), le nombre maximum de résultats à retourner, et les types de fichiers spécifiques à rechercher. Voici à quoi ressemble le processus de recherche :

// Setting the image search options
ImageSearchOptions imageSearchOptions = new ImageSearchOptions();
imageSearchOptions.HashDifferences = 10;
imageSearchOptions.MaxResultCount = 100;
imageSearchOptions.SearchDocumentFilter =
    SearchDocumentFilter.CreateFileExtension(".zip", ".png", ".jpg");

// Creating a reference image for search
SearchImage searchImage = SearchImage.Create(@"C:\MyDocuments\image0.png");

// Searching in the index
ImageSearchResult result = index.Search(searchImage, imageSearchOptions);

Le processus de recherche génère un hachage pour l’image de référence et le compare avec les images indexées. Le paramètre HashDifferences spécifie le seuil de similarité – plus la valeur est petite, plus la correspondance est stricte.

Étape 4 : Traitement des résultats de recherche

L’objet ImageSearchResult contient toutes les images qui répondent aux critères de recherche. Vous pouvez itérer à travers les résultats pour récupérer des informations sur les images correspondantes, y compris leurs emplacements ou métadonnées.

Console.WriteLine("Images found: " + result.ImageCount);
for (int i = 0; i < result.ImageCount; i++)
{
    FoundImageFrame image = result.GetFoundImage(i);
    Console.WriteLine(image.DocumentInfo.ToString());
}

Sample Output

Par exemple, si la recherche inversée d’image est effectuée avec une image de requête, les résultats suivants pourraient être obtenus :

Images found: 2
C:\MyDocuments\image0.png
C:\MyDocuments\image193.png

Cela signifie que deux images correspondantes ou similaires ont été trouvées dans les documents indexés : l’image de requête originale (image0.png) et un autre résultat (image193.png).

Étape 5 : Ajustement du système

Pour optimiser votre recherche d’images inversée, vous pouvez ajuster des options telles que :

Différences de hachage : Des valeurs plus basses augmentent la précision mais peuvent manquer des versions légèrement altérées de l’image.
Filtres de recherche : Restreindre les recherches à des types de fichiers ou des formats de document spécifiques.
Index Structure: Mettez régulièrement à jour l’index pour inclure de nouvelles images ou supprimer des fichiers obsolètes.

Conclusion

La recherche d’images inversée est une technologie puissante avec des applications variées dans les industries modernes, du commerce électronique à la criminalistique numérique. En tirant parti d’outils comme l’API GroupDocs.Search, les développeurs peuvent facilement mettre en œuvre des systèmes de recherche d’images robustes qui localisent et comparent efficacement des données visuelles. Avec des fonctionnalités telles que l’indexation d’images, des seuils de similarité ajustables, et un support pour les images intégrées ou autonomes, cette API simplifie le processus de création de solutions de recherche d’images inversée flexibles et précises. Que ce soit pour traquer des images dupliquées, vérifier l’authenticité, ou découvrir du contenu connexe, la mise en œuvre de cette fonctionnalité est une étape précieuse vers l’amélioration des expériences utilisateur et de l’efficacité opérationnelle.

Consultez ces liens utiles pour plus de détails et de ressources :

Recherche d'image inversée

Qu’est-ce que la recherche d’image inversée ?

Comment fonctionne la recherche d’image inversée ?

Implémentation de la recherche d’images inversée avec l’API GroupDocs.Search

Étape 1 : Configurer l’environnement

Étape 2 : Indexation des images

Étape 3 : Recherche d’images connexes

Étape 4 : Traitement des résultats de recherche

Sample Output

Étape 5 : Ajustement du système

Conclusion

Voir aussi

Qu’est-ce que la recherche d’image inversée ?#

Comment fonctionne la recherche d’image inversée ?#

Implémentation de la recherche d’images inversée avec l’API GroupDocs.Search#

Étape 1 : Configurer l’environnement#

Étape 2 : Indexation des images#

Étape 3 : Recherche d’images connexes#

Étape 4 : Traitement des résultats de recherche#

Sample Output#

Étape 5 : Ajustement du système#

Conclusion#

Voir aussi#

Qu’est-ce que la recherche d’image inversée ?

Comment fonctionne la recherche d’image inversée ?

Implémentation de la recherche d’images inversée avec l’API GroupDocs.Search

Étape 1 : Configurer l’environnement

Étape 2 : Indexation des images

Étape 3 : Recherche d’images connexes

Étape 4 : Traitement des résultats de recherche

Sample Output

Étape 5 : Ajustement du système

Conclusion

Voir aussi