Html en texte

arkane351 Messages postés 1 Date d'inscription mercredi 22 octobre 2003 Statut Membre Dernière intervention 23 octobre 2003 - 23 oct. 2003 à 20:49
cs_Delphiprog Messages postés 4297 Date d'inscription samedi 19 janvier 2002 Statut Membre Dernière intervention 9 janvier 2013 - 25 oct. 2003 à 10:41
Bonjour,

Je tente de dévelloper un programme qui me donnerais des informations concernants le contenue de page internet.
Cependant pou cela il me faut enregistré des pages et donc les traiter. les enregistrés pas de problème, cependant je me retrouve maintenant avec un fichier texte contenant le code complet de la page html (normal) seulement il faudrait que je "nettoie" ce fichier, lui enlevant donc tout les tags Html.

Etant un très nouvel initié au delphi, je ne sais pas s'il y a un outil qui permet de faire cela simplement ou bien faut il que je me lance dans une programmation de recherche des balises pour les supprimer???

Merci de m'aider à me dépatouiller de tout ça...

Ps: j'ai l'intention de stocké ces fichier texte alors bon sans les tags c'est mieux...

1 réponse

cs_Delphiprog Messages postés 4297 Date d'inscription samedi 19 janvier 2002 Statut Membre Dernière intervention 9 janvier 2013 32
25 oct. 2003 à 10:41
Principe de base avec HTML :
tout ce qui n'est pas une balise est du texte à afficher.

Principe 2 : dans le texte à afficher, les caractères "<" et ">" sont remplacés par "<" et ">" respectivement, il faudra donc traduire ces caractères par leur équivalent ASCII.
Et je passe sous silence les autres caractères Unicode qui sont la résultante de notre "exception culturelle" dont nous, petits français, sommes si fiers.

Après, que fait-on de la mise en page ?
Comment représenter, par exemple, un tableau HTML dans un éditeur affichant un simple texte ASCII ?

Tout ça pour dire qu'une traduction caractère par caractère n'est peut-être pas la meilleure approche en termes d'efficacité.

Si quelqu'un a une meilleure idée...
May Delphi be with you
0