Mastronic
Messages postés94Date d'inscriptionlundi 8 août 2005StatutMembreDernière intervention13 juin 2012 27 déc. 2006 à 00:54
si il est possible à partir d'une image de retrouvé le texte.. la preuve en ai que dans lors d'une inscription, on demande souvent de lire ce qui est ecrit sur une image.. et cette image est bien souvent déformé. j'aurais bien aimé de voir le code de ces OCR.. mais je pensse que ces OCR ne sont pas ecrit en PHP ( languages non compilé = plus lent.. )
j'ai ecris un autre code qui utilise les fonts ttf.. mais il faut que je le récris pour changé aléatoirement la couleur de la lettre, son inclinaison, sa taille.. voir ajouté du bruits... si j'ai le temps demain, je le ferais.. je crerais un nouveau projet (SIMPLE ANTI SPAM GENERATION 2)
Mais j'aurais bien aimé testé les OCR sur les images que je vais créer...alors si vous avez des tuyaux merci de me transmettre par message privée.
merci juki_webmaster pour le liens.
juki_webmaster
Messages postés947Date d'inscriptionmercredi 19 novembre 2003StatutMembreDernière intervention 5 avril 20083 26 déc. 2006 à 23:18
Webdeb > Ce n'est pas impossible, il existe des logiciels OCR.
http://fr.wikipedia.org/wiki/Captcha#Casseurs_de_Captcha Et il ce tombe BIEN! php-gd utilise une police par defaut qui simplifie les bots, et peu de gens savent implementer des deformations (torsions, zoom progressif etc..).
Ton commentaire s'adresser à moi en rapport avec le premier commentaire ? "sources de sortie" s'adresser à la source HTML.
webdeb
Messages postés488Date d'inscriptionsamedi 5 avril 2003StatutMembreDernière intervention31 mars 20094 26 déc. 2006 à 22:47
Il est impossible de faire de l'image -> text puisque une image est composée d'une matrice de valeurs. Chaque valeur représente la couleur d'un pixel. Pour un ordinateur, cette suite de valeur n'a aucune signification particulière. Il ne sait pas où se trouve le texte puisque celui-ci est en fait une image.
juki_webmaster
Messages postés947Date d'inscriptionmercredi 19 novembre 2003StatutMembreDernière intervention 5 avril 20083 26 déc. 2006 à 17:19
C'est une tres bonne question !
Les navigateurs de notre epoque convertie les url du type: http://site.com/truc.php?machin=ééééàààçççç en %12%25...
Mais ça c'est juste coté utilisateur, et puis certains le voudrons pas et consideront l'URL/URI comme étant invalide.
Les crawlers ne doit pas forcement trop apprecier cela.
Un espace classique peut decouper une URL/URI en deux, si ont as considerer que l'espace est un separateur, etc...
Les accents et leurs jeux d'encodage peuvent aussi posser probleme.
Mastronic
Messages postés94Date d'inscriptionlundi 8 août 2005StatutMembreDernière intervention13 juin 2012 26 déc. 2006 à 15:24
Merci Juki.
c tres juste il faut codé la chaine.. au depart je voulais serialisé les arguments mais je me souvenais plus de l'instruction. ok, je fais une remise à jours pour ce soir.
Question: je vois toujours remplacer les espaces par %20... mais si on ne l'effectue pas, cela fonctionne ( sous IE) Alors pourquoi le faire?
Encore Merci
juki_webmaster
Messages postés947Date d'inscriptionmercredi 19 novembre 2003StatutMembreDernière intervention 5 avril 20083 26 déc. 2006 à 15:10
Un espace classique dans une URI/URL ? -> urlencode() (%20)
Pas terrible, l'email est en claire dans les sources de sortie, ça revient au meme qu'un lien mailto:
Je te conseille au moins d'utiliser base64_encode() & base64_decode(), ou strrev() au minimum.
27 déc. 2006 à 00:54
j'ai ecris un autre code qui utilise les fonts ttf.. mais il faut que je le récris pour changé aléatoirement la couleur de la lettre, son inclinaison, sa taille.. voir ajouté du bruits... si j'ai le temps demain, je le ferais.. je crerais un nouveau projet (SIMPLE ANTI SPAM GENERATION 2)
Mais j'aurais bien aimé testé les OCR sur les images que je vais créer...alors si vous avez des tuyaux merci de me transmettre par message privée.
merci juki_webmaster pour le liens.
26 déc. 2006 à 23:18
http://fr.wikipedia.org/wiki/Captcha#Casseurs_de_Captcha
Et il ce tombe BIEN! php-gd utilise une police par defaut qui simplifie les bots, et peu de gens savent implementer des deformations (torsions, zoom progressif etc..).
Ton commentaire s'adresser à moi en rapport avec le premier commentaire ? "sources de sortie" s'adresser à la source HTML.
26 déc. 2006 à 22:47
26 déc. 2006 à 17:19
Les navigateurs de notre epoque convertie les url du type: http://site.com/truc.php?machin=ééééàààçççç en %12%25...
Mais ça c'est juste coté utilisateur, et puis certains le voudrons pas et consideront l'URL/URI comme étant invalide.
Les crawlers ne doit pas forcement trop apprecier cela.
Un espace classique peut decouper une URL/URI en deux, si ont as considerer que l'espace est un separateur, etc...
Les accents et leurs jeux d'encodage peuvent aussi posser probleme.
Il me semble que c'est pour avant tout respecter la RFC 2396, http://www.ietf.org/rfc/rfc2396.txt .
26 déc. 2006 à 15:24
c tres juste il faut codé la chaine.. au depart je voulais serialisé les arguments mais je me souvenais plus de l'instruction. ok, je fais une remise à jours pour ce soir.
Question: je vois toujours remplacer les espaces par %20... mais si on ne l'effectue pas, cela fonctionne ( sous IE) Alors pourquoi le faire?
Encore Merci
26 déc. 2006 à 15:10
Pas terrible, l'email est en claire dans les sources de sortie, ça revient au meme qu'un lien mailto:
Je te conseille au moins d'utiliser base64_encode() & base64_decode(), ou strrev() au minimum.