[PHP5 - DOM - XPATH] CLASSE DE PRE-FILTRAGE DE TEXTE

Signaler
Messages postés
449
Date d'inscription
jeudi 26 août 2004
Statut
Membre
Dernière intervention
5 mars 2009
-
Messages postés
449
Date d'inscription
jeudi 26 août 2004
Statut
Membre
Dernière intervention
5 mars 2009
-
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/41311-php5-dom-xpath-classe-de-pre-filtrage-de-texte

Messages postés
449
Date d'inscription
jeudi 26 août 2004
Statut
Membre
Dernière intervention
5 mars 2009

Voila alors le code a ete mis a jour.
Petit plus : la fonction Filtre::Analyse() renvoi toujours un tableau sauf que maintenant, 2 cases sont predefinies, il s'agit de 'foo' et 'final'. 'foo' est une case qui contient le nombre de mots trouves par la classe, 'final' est la somme de tous les pourcentages calcules par la classe (ce qui permet de savoir connaitre le pourcentage final de mots interdits dans une phrase sans en avoir fait le calcul)

@+
Messages postés
449
Date d'inscription
jeudi 26 août 2004
Statut
Membre
Dernière intervention
5 mars 2009

Alalala... j'avais raison ! Comme d'hab tu m'en apporte plus qu'il ne m'en faut... ^^

J'ai trouve tes classes et j'ai lu les topics aussi j'avais quelques questions :
- je vais coder ma propre implementation de soundex (non pas que la tienne n'est pas bonne au contraire mais je desire comprendre).
Voila ce que j'ai trouve sur php.net
Soundex()
=> http://www.php.net/manual/fr/function.soundex.php
Levenshtein()
=> http://www.php.net/manual/fr/function.levenshtein.php
Metaphone()
=> http://www.php.net/manual/fr/function.metaphone.php

Je comprend l'interet de soundex() et metaphone() mais je ne comprend pas levenshtein. L'algo mathematique me donne mal a la tronche et l'exemple ne me parle pas franchement. Tu pourrais m'expliquer STP ?

"OUUUUUUUUUF!! ^^"
J'imagine bien ton soulagement ;-)

Je crois que je vais recoder ma classe en implementant au moins la focntion soundex histoire d'etre un peu plus precis.

A bientot ;-)
Messages postés
10840
Date d'inscription
lundi 24 février 2003
Statut
Modérateur
Dernière intervention
2 mars 2010
21
"Donc en conclusion, je dirais que cette classe n'a pas vocation de bot virtuel et qu'elle ne remplacera jamais le travail d'un bon admin sur un forum"

OUUUUUUUUUF!! ^^

Pour le reste, je sais...je disais juste ça comme ça ;-) On ne peut pas, dans ce domaine, trouver LA parade. Pas encore en tous cas.

A propos de phonétique,
"J'ai voulu egalement utilise la phonetique pour pallier ce genre de probleme mais je n'ai pas eu le temps de poussees mes recherches",
fouille mes sources...;-)
Messages postés
449
Date d'inscription
jeudi 26 août 2004
Statut
Membre
Dernière intervention
5 mars 2009

Malalam >
"juste pour dire que je testerai ta classe et la lirai en détail"
J'esperai vraiment que tu me dises sa, tes conseils m'on toujours ete utile ! Tiens moi au courant :p

"ce qui manquera de toutes façons à un tel code, c'est prévois les erreurs humaines [...] Et puis, les internautes récalcitrants s'amuseront aussi : mairde! ou merdeuh"
J'en ai bien conscience aussi j'ai pris soins de virer tout signes de ponctuation de chaque mot extrait. La liste est modifiable a souhait, on l'a reconnait du premier coup d'oeil ;-). J'ai voulu egalement utilise la phonetique pour pallier ce genre de probleme mais je n'ai pas eu le temps de poussees mes recherches. Je sais que mysql le gere mais je ne voulais pas utiliser une base sql. Je continuerai mes recherches un peu plus tard car j'ai pas mal de taf a la bourre mais promis je garderai l'idee jusqu'au moment venu.
Pour tous les trucs genre "merdeuh", il faut d'abord comprendre le contexte. J'ai code cette classe pour un site qui se fait constament spamme par des internautes vraiment pas tres intelligent. Des membres du site du zero pense que nous avons copie leurs sites (http://www.inzeprog.info) et nous recevions (le livre d'or a ferme) beaucoup de messages du style : bande de copieur, vous etes trop null ect...
Les messages ete globalement les memes donc une telle protection aurait ete largement suffisante. Ensuite, j'aurais beau travailer a la nasa, je ne serai jamais a l'abri de ce genre de contours et personne d'ailleurs ne le sera, il faut se l'avouer ;-)
C'est pour cela que j'ai qualifie ce code de "pre-filtrage". Il ne fera qu'informer les webmasters qu'un message est potentiellement non conforme a l'ethique. Ainsi, si jamais un developpeur code l'envoi d'un mail a chaque alerte, un modo pourra alors cibler le message et aviser en fonction.
Un travail de mise a jour de la base sera egalement necessaire afin de se conformer au mieux aux propos des internautes qui frequent un site protege par cette classe (si on peut parler de protection evidement) ainsi qu'une rigueur dans le choix des categories du fichier xml.

Donc en conclusion, je dirais que cette classe n'a pas vocation de bot virtuel et qu'elle ne remplacera jamais le travail d'un bon admin sur un forum. Elle pourra par contre etre utilise dans un webmail perso (je ne vise pas les gros sites genre laposte ou gmail, j'en suis parfaitement conscient) et peut permettre d'acceder a un certains niveau de confort a de petit developpeur voulant proposer de bons services sans chercher a devenir milliardaire ^^

C'est a peu de chose pres mon etat d'esprit quand je code et que je poste sur CS.

J'espere ne pas avoir dit trop de betises :p

@++
Afficher les 8 commentaires