pascal16m
Messages postés73Date d'inscriptionjeudi 19 juin 2003StatutMembreDernière intervention12 novembre 2020 9 nov. 2003 à 13:33
au lieu du CR32, on peut varirer aussi en ne comparant q'un octet sur 10 dans les fichiers et 2 fichiers avec 10% de code identiqes pris au hasard ont 99% de chance d'être identiques.
pour des images quasi identiques, c'est beaucoup plus compliqué, le JPEG est compressé et peu de différences théoriques donne des différences réelles très variable. Si on les décompresse (comme un BMP en mémoire), là on compare vraiment, c'est dur mais ça a rien d'impossible.
Perso, c'est sutout sur le tri que je me suis focalisé, la dichotomie par récurrence éclate tout et de loin !
cs_EBArtSoft
Messages postés4525Date d'inscriptiondimanche 29 septembre 2002StatutModérateurDernière intervention22 avril 20199 7 nov. 2003 à 23:30
JcDuss> dans ce cas la technique de Pascal16m peut etre utilisé en appliquant un taux d'erreur a definir par l'utilisateur.
par exemple si les pixels de deux images (redimentionné a une taille semblable) correspondent a plus de 90% ont peu alors les considerer comme identique...
(on peu aussi faire une correspondance de contraste sur le meme principe)
@+
cs_JcDuss
Messages postés37Date d'inscriptionjeudi 9 janvier 2003StatutMembreDernière intervention23 avril 2004 7 nov. 2003 à 23:15
Et pour des photos legerement differentes?
genre la meme, mais avec un cadre de couleur, ou un zoom pour recentrer.
Des photos parfaitement identiques, c'est moins courant que des photos qui se ressemblent.
Quelqu'un connait un truc pour ca en vb ?
Duss
cs_PROGRAMMIX
Messages postés1133Date d'inscriptionmercredi 2 octobre 2002StatutMembreDernière intervention24 juillet 20112 7 nov. 2003 à 21:33
Merci du renseignement
cs_EBArtSoft
Messages postés4525Date d'inscriptiondimanche 29 septembre 2002StatutModérateurDernière intervention22 avril 20199 7 nov. 2003 à 21:22
Et bien c'est "simplement" une addition sur 32 bits de tout les octets d'un fichier c'est en gros la signature numeric de celui-ci !
Bien sur le nombre de bit du crc determine sa pertinence.
Cette technique permet de comparer un nombre plutot
qu'un tableau de données (donc gain de temps)
Il y a plein de source et d'exemple a ce sujet sur le net
B@nne prog
cs_PROGRAMMIX
Messages postés1133Date d'inscriptionmercredi 2 octobre 2002StatutMembreDernière intervention24 juillet 20112 7 nov. 2003 à 21:12
>>EBArtSoft : c'est quoi Crc32 ?
cs_EBArtSoft
Messages postés4525Date d'inscriptiondimanche 29 septembre 2002StatutModérateurDernière intervention22 avril 20199 7 nov. 2003 à 21:09
J'en ai un a te proposer :
- D'abord tu fait la liste de tout les fichiers dans un tableau
- Tu calcule le Crc32 de chaque fichier
- Et tu fait le tris des doublons
(Cette technique marche avec n'importe quel sorte de fichier)
9 nov. 2003 à 13:33
pour des images quasi identiques, c'est beaucoup plus compliqué, le JPEG est compressé et peu de différences théoriques donne des différences réelles très variable. Si on les décompresse (comme un BMP en mémoire), là on compare vraiment, c'est dur mais ça a rien d'impossible.
Perso, c'est sutout sur le tri que je me suis focalisé, la dichotomie par récurrence éclate tout et de loin !
7 nov. 2003 à 23:30
par exemple si les pixels de deux images (redimentionné a une taille semblable) correspondent a plus de 90% ont peu alors les considerer comme identique...
(on peu aussi faire une correspondance de contraste sur le meme principe)
@+
7 nov. 2003 à 23:15
genre la meme, mais avec un cadre de couleur, ou un zoom pour recentrer.
Des photos parfaitement identiques, c'est moins courant que des photos qui se ressemblent.
Quelqu'un connait un truc pour ca en vb ?
Duss
7 nov. 2003 à 21:33
7 nov. 2003 à 21:22
Bien sur le nombre de bit du crc determine sa pertinence.
Cette technique permet de comparer un nombre plutot
qu'un tableau de données (donc gain de temps)
Il y a plein de source et d'exemple a ce sujet sur le net
B@nne prog
7 nov. 2003 à 21:12
7 nov. 2003 à 21:09
- D'abord tu fait la liste de tout les fichiers dans un tableau
- Tu calcule le Crc32 de chaque fichier
- Et tu fait le tris des doublons
(Cette technique marche avec n'importe quel sorte de fichier)
@+