DECODEUR DE CODE IMAGÉ DE MEGAUPLOAD

jantosze Messages postés 72 Date d'inscription mercredi 29 mai 2013 Statut Membre Dernière intervention 15 mai 2009 - 1 sept. 2009 à 10:54
Flocreate Messages postés 300 Date d'inscription lundi 17 juillet 2006 Statut Membre Dernière intervention 27 mai 2012 - 25 oct. 2010 à 19:21
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/50506-decodeur-de-code-image-de-megaupload

Flocreate Messages postés 300 Date d'inscription lundi 17 juillet 2006 Statut Membre Dernière intervention 27 mai 2012 3
25 oct. 2010 à 19:21
Bonjour, en effet, ce code n'a aucune prétention et la note est justifiée ;)

Maintenant il y a la partie pour télécharger le GIF a partir de l'URL MegaUpload en dynamique.
Il manque la segmentation et le réseau de neurone, j'ai fait pas mal de recherches mais pour le moment je n'arrive pas a faire mieux.
si des personnes ont des algos éprouvés je suis toujours preneur...
tarikibtissam Messages postés 3 Date d'inscription samedi 25 février 2006 Statut Membre Dernière intervention 25 octobre 2010
25 oct. 2010 à 19:02
c rien du tout
jantosze Messages postés 72 Date d'inscription mercredi 29 mai 2013 Statut Membre Dernière intervention 15 mai 2009
7 sept. 2009 à 10:40
Slt,
Comme le montre http://dba.ticalc.org/Projets/2dfft/index.htm la FFT 2D est un tableau 2D des coefficients de la transformée. De mémoire cette matrice est pratiquement creuse ( d'où l'intérêt d'utiliser les FFT en compressions d'images en transférant uniquement les coeffs sans trop de pertes lors de la restitution), de plus c'est un spectre en fréquence et en observant l'énergie de ce spectre on doit pouvoir retrouver par rapport à des modèles à qui il ressemble le plus (l'intérêt d'un perceptron par exemple).
EN outre, comme le bruit appartient à des valeurs basses du spectre appelées résidus on peut appliquer un filtrage simple par lissage de ces bruits et ne conserver que la partie forte des coefficients (je te fais grâce des erreurs du type première ou seconde espèce) donc géolocaliser le ou les caractères (par exemple lorsque 2 caractères se touchent ou s'entrecroisent...), soustraire (il me semble que dans le domaine fréquentiel c'est un filtre passe-bande)l'une des formes reconnues et réaliser la FFT-1 pour reconstruire le caractère...
Cdt,
JAN
Flocreate Messages postés 300 Date d'inscription lundi 17 juillet 2006 Statut Membre Dernière intervention 27 mai 2012 3
4 sept. 2009 à 22:19
une petite question au sujet de la FFT 2D
je comprends bien l'utilisation de la FFT 1D, mais comment apliquer la FFT 2D ? par la, j'entends que, comment obtenir une "courbe y=f(x)" à partir d'un tableau à deux dimensions.
le liens que tu donne dit que pour une FFT 2D il faut faire successivement 2 FFT 1D, sur les lignes puis sur les colones (ou inversement) je me trompe ? au final, ca reste u tableau a 2 dimensions ???
Flocreate Messages postés 300 Date d'inscription lundi 17 juillet 2006 Statut Membre Dernière intervention 27 mai 2012 3
4 sept. 2009 à 22:04
merci pour tes liens JANTOZE,
"
Tu évoque un système neuronale type réseau linaire je suppose, donc apprentissage sur une base de référence dont le nombre de cas risque d'être élevé du fait de la diversité des tailles, des positions et des formes. Je pense que tu devrais traiter la forme brute avec la FFT ce qui te permettrai d'obtenir une normalisation de la forme et de sa position dans l'espace 2D, puis utiliser un réseau linéaire pour retrouver dans ta base de connaissance (ici l'alphabet +chiffres) la bonne correspondance. Je crois que tu gagnerai en facilité de développement/maintenance, vitesse, précision, et taille mémoire
"

je parle bien d'un réseau de neurone linéaire à couche caché.
en ce sui concerne la base d'apprentissage, il se trouve que mon cahier des charges m'aide assez.
les lettres ont tjs la même taille et je les recentre, ce qui fait qu'elle sont tjs placées de la même facon. en revenche l'inclinaison change.
Pour cette raison, je ne contais pas me prendre la tête avec une normalisation.

cordialement,
jantosze Messages postés 72 Date d'inscription mercredi 29 mai 2013 Statut Membre Dernière intervention 15 mai 2009
4 sept. 2009 à 11:31
Slt,
Tu peux regarder les premiers slides de http://bib.gdr-isis.org/1740/01/RDF_024_PRESENTATION-SMACH.pdf qui décrivent la reconnaissance binaire d'une image 2D. ou http://www.adaptyv.com/fr/search.php?query=&topic=1&author= pour comprendre les mécanismes

La modélisation de la FFT et de son inverse à http://dba.ticalc.org/Projets/2dfft/index.htm

Pour le codage http://www.csharpfr.com/r/global.aspx?r=algorithme+de+reconnaissance+de+la+forme te donnera qq pistes. Il existe peut être la même chose dans les pages VB de ce site. Voir peut être une édition Française de Numerical recipe mais je ne suis pas certain que cela existe!!!

Tu évoque un système neuronale type réseau linaire je suppose, donc apprentissage sur une base de référence dont le nombre de cas risque d'être élevé du fait de la diversité des tailles, des positions et des formes. Je pense que tu devrais traiter la forme brute avec la FFT ce qui te permettrai d'obtenir une normalisation de la forme et de sa position dans l'espace 2D, puis utiliser un réseau linéaire pour retrouver dans ta base de connaissance (ici l'alphabet +chiffres) la bonne correspondance. Je crois que tu gagnerai en facilité de développement/maintenance, vitesse, précision, et taille mémoire

cdt
JAN
Flocreate Messages postés 300 Date d'inscription lundi 17 juillet 2006 Statut Membre Dernière intervention 27 mai 2012 3
3 sept. 2009 à 18:04
bonjour, en ce qui concerne la séparation des lettres et chiffre c'est déjà implémenté dans la version en ligne ci dessus.
Enfin, c'est partiellement fait car je ne me suis pas occupé du recouvrement des lettres (c'est une évolution en cours de dev).

mais si tu pouvait m'expliquer ou m'indiquer un document (vf) bien expliqué de l'utilisation d'une FFT pour la reconnaissance de lettres, cela m'aiderait grandement.
pour le momment je me dirigeais plutot vers un système neuronal (voir 2 : 1 pour les lettres et un pour les chiffres)
jantosze Messages postés 72 Date d'inscription mercredi 29 mai 2013 Statut Membre Dernière intervention 15 mai 2009
1 sept. 2009 à 10:54
Salut,

Bien que n'ayant pas regardé ton code, le sujet est intéressant et il me rappelle les problématiques du traitement du signal en particulier retrouver un signal dans du bruit... Je pense que les mécanismes des dérivées graphiques (transposé à la 2D) devrait te permettre de traiter la localisation des lettres et des chiffres. Les FFT rapides te permettront de passer du domaine temporel au domaine fréquentiel et d'obtenir une signature spécifique pour une lettre, puis il suffit de la comparer par corrélation à une base de signatures pour identifier la lettre ou le chiffre (c'est un mécanisme utilisé en spectrométrie par exemple) et en plus très performant en vitesse et mémoire.

Si ces pistes peuvent t'aider...
JAN
Rejoignez-nous