dirthangel
Messages postés19Date d'inscriptionlundi 5 mai 2003StatutMembreDernière intervention19 juin 2007
-
30 mai 2007 à 00:05
dirthangel
Messages postés19Date d'inscriptionlundi 5 mai 2003StatutMembreDernière intervention19 juin 2007
-
30 mai 2007 à 02:11
salut a tous, je developpe un moteur de recherche en C# ( en fait un portage depuis perl ), comme vous savez il existe différent encodage sur le web tel que utf-8, big5 etc... voila mon problème en perl j'utilise la puissante lib Encode afin de transcoder les pages non utf-8 en ce dernier, mon problème avec C# c'est que je n'ais pas trouvé d'équivalent la classe System.Text.Encoding ne fournit qu'un nombre limité d'encodage imaginé la mixture infecte obtenue en lisant une page encoder en Big5 en utf-8 :s.
Comment transcoder de disont Big5 a utf-8 sachant que Text.Encoding ne fournit pas big5 ?
Au pire je peut faire transcoder par perl mais bon :s
dirthangel
Messages postés19Date d'inscriptionlundi 5 mai 2003StatutMembreDernière intervention19 juin 2007 30 mai 2007 à 02:11
J'ai trouvé comment convertir d'un encodage a un autre :) , mais un problème demeure beaucoup de page web ne comporte pas de balise Content-Type aussi je voudrais savoir si il existe en .Net une fonction permettant de déterminer l'encodage d'un document en ce basant uniquement sur les bytes