RÉSUMER UN TEXTE SANS COUPER LES MOTS OU PHRASES

Messages postés
6
Date d'inscription
mardi 15 février 2005
Statut
Membre
Dernière intervention
31 octobre 2006
- - Dernière réponse : cs_olid
Messages postés
296
Date d'inscription
lundi 2 septembre 2002
Statut
Membre
Dernière intervention
28 janvier 2008
- 17 mai 2008 à 20:57
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/40147-resumer-un-texte-sans-couper-les-mots-ou-phrases

cs_olid
Messages postés
296
Date d'inscription
lundi 2 septembre 2002
Statut
Membre
Dernière intervention
28 janvier 2008
-
Raaaaaaaaah merde, la fonction n'est pas faite pour du UTF8 (Cf. tinywords) ni pour de l'Unicode. Les strlen peuvent provoquer une mauvaise estimation de la longueur. Faut les remplacer par le strlen MultiBytes qui nécessite la présence de ce module sur le serveur.
cs_christobal
Messages postés
208
Date d'inscription
jeudi 3 octobre 2002
Statut
Membre
Dernière intervention
31 mars 2011
-
c'est dr?le car tu as trouv? un bug avec le ? et le ! alors que je te parlais du " a " avec accent.
Il semblerait que le systeme de post de phpcs est eu un petit souci de convertion de lettres accentu?s.
pour mon pb de txt court, il n'y a pas de html dans le txt.
j'aivais enlev? le html a cause des photos qu'il pouvais y avoir au debut des articles
cs_olid
Messages postés
296
Date d'inscription
lundi 2 septembre 2002
Statut
Membre
Dernière intervention
28 janvier 2008
-
Hum, tout d'abord, en production, j'ai été obligé de corriger plein de trucs, je partagerais un update asap.

Perso, jai désactivé les tinywords car çà merde beaucoup, et grosse perte de performance.

Et, tu me fais justement remarqué que la fonction ne gère pas les césures avec un ! ou ? ... Je vais plancher la dessus.

Enfin, n'oublie pas de fournir un texte sans HTML, via strip_tags... Ca peut expliquer ton petit résumé si ya du code CSS ;op
cs_christobal
Messages postés
208
Date d'inscription
jeudi 3 octobre 2002
Statut
Membre
Dernière intervention
31 mars 2011
-
bonjour,
je ne comprand pas pourquoi la phrase se termine apres un " ? "alors qu'il a ?t? d?finis dans les mots a ne pas prandre.
$tinyWords = array(':',';','a','?','au', ...
autre chose j'ai un r?sum? de 177 caracteres alor que j'en ai defini 400 dans la fonction et l'article contient plusieurs centaines de lignes.
merci de votre aide et bon week
cs_olid
Messages postés
296
Date d'inscription
lundi 2 septembre 2002
Statut
Membre
Dernière intervention
28 janvier 2008
-
Pour info, la version RegEx proposée n'a pas donnée le résultat espérée d'un point de vue effeicacité... Pas comparé pour les performances :op