Trouve les images en double dans le même répertoir

Soyez le premier à donner votre avis sur cette source.

Vue 4 347 fois - Téléchargée 491 fois

Description

on lui donne un répertoire plein de photos.
on en ajoute d'autres si on veut
il rechercher les fichiers identiques bit à bit (avec une grosse touche 'supprimer' quand c'est fini).
il commence par comparer les tailles.
si elle sont identiques, il les compare alors bit à bit.
pour accélérer la comparaison des tailles, un tri est fait par dichitomie récursive
le logiciel donne des stats (temps mi, nombre de fichiers traités)
on peut comparer les méthodes, exemple :
test avec 4995 fichiers :
comparaison normal sans tri : 52 secondes
comparaison avec tri par dichotomie : 7 secondes (dont moins de 2 pour le tri)

A la fin, on peut choisir de déplacer ou supprimer les doublons.

Source / Exemple :


' cf source, trop long

Codes Sources

A voir également

Ajouter un commentaire

Commentaires

pascal16m
Messages postés
67
Date d'inscription
jeudi 19 juin 2003
Statut
Membre
Dernière intervention
13 juillet 2019
-
au lieu du CR32, on peut varirer aussi en ne comparant q'un octet sur 10 dans les fichiers et 2 fichiers avec 10% de code identiqes pris au hasard ont 99% de chance d'être identiques.

pour des images quasi identiques, c'est beaucoup plus compliqué, le JPEG est compressé et peu de différences théoriques donne des différences réelles très variable. Si on les décompresse (comme un BMP en mémoire), là on compare vraiment, c'est dur mais ça a rien d'impossible.

Perso, c'est sutout sur le tri que je me suis focalisé, la dichotomie par récurrence éclate tout et de loin !
cs_EBArtSoft
Messages postés
4531
Date d'inscription
dimanche 29 septembre 2002
Statut
Modérateur
Dernière intervention
22 avril 2019
5 -
JcDuss> dans ce cas la technique de Pascal16m peut etre utilisé en appliquant un taux d'erreur a definir par l'utilisateur.

par exemple si les pixels de deux images (redimentionné a une taille semblable) correspondent a plus de 90% ont peu alors les considerer comme identique...

(on peu aussi faire une correspondance de contraste sur le meme principe)

@+
cs_JcDuss
Messages postés
37
Date d'inscription
jeudi 9 janvier 2003
Statut
Membre
Dernière intervention
23 avril 2004
-
Et pour des photos legerement differentes?
genre la meme, mais avec un cadre de couleur, ou un zoom pour recentrer.

Des photos parfaitement identiques, c'est moins courant que des photos qui se ressemblent.

Quelqu'un connait un truc pour ca en vb ?

Duss
cs_PROGRAMMIX
Messages postés
1134
Date d'inscription
mercredi 2 octobre 2002
Statut
Membre
Dernière intervention
24 juillet 2011
-
Merci du renseignement
cs_EBArtSoft
Messages postés
4531
Date d'inscription
dimanche 29 septembre 2002
Statut
Modérateur
Dernière intervention
22 avril 2019
5 -
Et bien c'est "simplement" une addition sur 32 bits de tout les octets d'un fichier c'est en gros la signature numeric de celui-ci !
Bien sur le nombre de bit du crc determine sa pertinence.

Cette technique permet de comparer un nombre plutot
qu'un tableau de données (donc gain de temps)

Il y a plein de source et d'exemple a ce sujet sur le net

B@nne prog

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.