Decodeur de code imagé de megaupload

Soyez le premier à donner votre avis sur cette source.

Vue 8 759 fois - Téléchargée 570 fois

Description

Avant toute chose, il doit être évident que ce projet n'a pas pour but de permettre l'automatisation d'un téléchargement sur megaupload mais de se fixer un projet interressant.

Ce programme à pour but, à partir d'une image (GIF) du code megaupload d'en trouver la transcription automatiquement.
Le code est constitué de 3 lettres suivies d'un chiffre. "[A-Z]{3}[1-9]{1}" pour les intimes ^^
Le résultat n'est pas nécéssairement trouvable à 100%, mais il ne doit pas être en dessous de 90%.
Les images fon en moyenne 80pxl de large et 30 de haut. les performances ne sont donc pas une priorité.

La première étape est de séparer les lettres du code
La seconde de reconnaitre les 3 lettre et le chiffre

Conclusion :


Pour le momment la première étape est franchie,
La seconde est en cours de recherche (c'est la plus hardue)

remarque :
dans le code actuel, la seconde étape (T0 -> T1 affiché sur P2) sert à faire ressortir les bordures des lettre. Mais finalement, je ne m'en sert pas.
Je l'ai cependant l'aissé pour garder l'algo dans un coin. (serra supprimé dans la version finale)

si une personne connait de meilleurs méthodes (+ performantes/rapide) pour parvenir aux deux étapes, qu'il le dise, je me ferais une immense joie de les étudier.

Codes Sources

A voir également

Ajouter un commentaire

Commentaires

Flocreate
Messages postés
307
Date d'inscription
lundi 17 juillet 2006
Statut
Membre
Dernière intervention
27 mai 2012
3 -
Bonjour, en effet, ce code n'a aucune prétention et la note est justifiée ;)

Maintenant il y a la partie pour télécharger le GIF a partir de l'URL MegaUpload en dynamique.
Il manque la segmentation et le réseau de neurone, j'ai fait pas mal de recherches mais pour le moment je n'arrive pas a faire mieux.
si des personnes ont des algos éprouvés je suis toujours preneur...
tarikibtissam
Messages postés
3
Date d'inscription
samedi 25 février 2006
Statut
Membre
Dernière intervention
25 octobre 2010
-
c rien du tout
jantosze
Messages postés
72
Date d'inscription
mercredi 29 mai 2013
Statut
Membre
Dernière intervention
15 mai 2009
-
Slt,
Comme le montre http://dba.ticalc.org/Projets/2dfft/index.htm la FFT 2D est un tableau 2D des coefficients de la transformée. De mémoire cette matrice est pratiquement creuse ( d'où l'intérêt d'utiliser les FFT en compressions d'images en transférant uniquement les coeffs sans trop de pertes lors de la restitution), de plus c'est un spectre en fréquence et en observant l'énergie de ce spectre on doit pouvoir retrouver par rapport à des modèles à qui il ressemble le plus (l'intérêt d'un perceptron par exemple).
EN outre, comme le bruit appartient à des valeurs basses du spectre appelées résidus on peut appliquer un filtrage simple par lissage de ces bruits et ne conserver que la partie forte des coefficients (je te fais grâce des erreurs du type première ou seconde espèce) donc géolocaliser le ou les caractères (par exemple lorsque 2 caractères se touchent ou s'entrecroisent...), soustraire (il me semble que dans le domaine fréquentiel c'est un filtre passe-bande)l'une des formes reconnues et réaliser la FFT-1 pour reconstruire le caractère...
Cdt,
JAN
Flocreate
Messages postés
307
Date d'inscription
lundi 17 juillet 2006
Statut
Membre
Dernière intervention
27 mai 2012
3 -
une petite question au sujet de la FFT 2D
je comprends bien l'utilisation de la FFT 1D, mais comment apliquer la FFT 2D ? par la, j'entends que, comment obtenir une "courbe y=f(x)" à partir d'un tableau à deux dimensions.
le liens que tu donne dit que pour une FFT 2D il faut faire successivement 2 FFT 1D, sur les lignes puis sur les colones (ou inversement) je me trompe ? au final, ca reste u tableau a 2 dimensions ???
Flocreate
Messages postés
307
Date d'inscription
lundi 17 juillet 2006
Statut
Membre
Dernière intervention
27 mai 2012
3 -
merci pour tes liens JANTOZE,
"
Tu évoque un système neuronale type réseau linaire je suppose, donc apprentissage sur une base de référence dont le nombre de cas risque d'être élevé du fait de la diversité des tailles, des positions et des formes. Je pense que tu devrais traiter la forme brute avec la FFT ce qui te permettrai d'obtenir une normalisation de la forme et de sa position dans l'espace 2D, puis utiliser un réseau linéaire pour retrouver dans ta base de connaissance (ici l'alphabet +chiffres) la bonne correspondance. Je crois que tu gagnerai en facilité de développement/maintenance, vitesse, précision, et taille mémoire
"

je parle bien d'un réseau de neurone linéaire à couche caché.
en ce sui concerne la base d'apprentissage, il se trouve que mon cahier des charges m'aide assez.
les lettres ont tjs la même taille et je les recentre, ce qui fait qu'elle sont tjs placées de la même facon. en revenche l'inclinaison change.
Pour cette raison, je ne contais pas me prendre la tête avec une normalisation.

cordialement,

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.