Trouve les images en double dans le même répertoir

0/5 (7 avis)

Vue 4 724 fois - Téléchargée 530 fois

Description

on lui donne un répertoire plein de photos.
on en ajoute d'autres si on veut
il rechercher les fichiers identiques bit à bit (avec une grosse touche 'supprimer' quand c'est fini).
il commence par comparer les tailles.
si elle sont identiques, il les compare alors bit à bit.
pour accélérer la comparaison des tailles, un tri est fait par dichitomie récursive
le logiciel donne des stats (temps mi, nombre de fichiers traités)
on peut comparer les méthodes, exemple :
test avec 4995 fichiers :
comparaison normal sans tri : 52 secondes
comparaison avec tri par dichotomie : 7 secondes (dont moins de 2 pour le tri)

A la fin, on peut choisir de déplacer ou supprimer les doublons.

Source / Exemple :


' cf source, trop long

Codes Sources

A voir également

Ajouter un commentaire Commentaires
pascal16m Messages postés 73 Date d'inscription jeudi 19 juin 2003 Statut Membre Dernière intervention 12 novembre 2020
9 nov. 2003 à 13:33
au lieu du CR32, on peut varirer aussi en ne comparant q'un octet sur 10 dans les fichiers et 2 fichiers avec 10% de code identiqes pris au hasard ont 99% de chance d'être identiques.

pour des images quasi identiques, c'est beaucoup plus compliqué, le JPEG est compressé et peu de différences théoriques donne des différences réelles très variable. Si on les décompresse (comme un BMP en mémoire), là on compare vraiment, c'est dur mais ça a rien d'impossible.

Perso, c'est sutout sur le tri que je me suis focalisé, la dichotomie par récurrence éclate tout et de loin !
cs_EBArtSoft Messages postés 4525 Date d'inscription dimanche 29 septembre 2002 Statut Modérateur Dernière intervention 22 avril 2019 9
7 nov. 2003 à 23:30
JcDuss> dans ce cas la technique de Pascal16m peut etre utilisé en appliquant un taux d'erreur a definir par l'utilisateur.

par exemple si les pixels de deux images (redimentionné a une taille semblable) correspondent a plus de 90% ont peu alors les considerer comme identique...

(on peu aussi faire une correspondance de contraste sur le meme principe)

@+
cs_JcDuss Messages postés 37 Date d'inscription jeudi 9 janvier 2003 Statut Membre Dernière intervention 23 avril 2004
7 nov. 2003 à 23:15
Et pour des photos legerement differentes?
genre la meme, mais avec un cadre de couleur, ou un zoom pour recentrer.

Des photos parfaitement identiques, c'est moins courant que des photos qui se ressemblent.

Quelqu'un connait un truc pour ca en vb ?

Duss
cs_PROGRAMMIX Messages postés 1133 Date d'inscription mercredi 2 octobre 2002 Statut Membre Dernière intervention 24 juillet 2011 2
7 nov. 2003 à 21:33
Merci du renseignement
cs_EBArtSoft Messages postés 4525 Date d'inscription dimanche 29 septembre 2002 Statut Modérateur Dernière intervention 22 avril 2019 9
7 nov. 2003 à 21:22
Et bien c'est "simplement" une addition sur 32 bits de tout les octets d'un fichier c'est en gros la signature numeric de celui-ci !
Bien sur le nombre de bit du crc determine sa pertinence.

Cette technique permet de comparer un nombre plutot
qu'un tableau de données (donc gain de temps)

Il y a plein de source et d'exemple a ce sujet sur le net

B@nne prog

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.