Comment convertir tout type d'encodage en utf-8

dirthangel Messages postés 19 Date d'inscription lundi 5 mai 2003 Statut Membre Dernière intervention 19 juin 2007 - 30 mai 2007 à 00:05
dirthangel Messages postés 19 Date d'inscription lundi 5 mai 2003 Statut Membre Dernière intervention 19 juin 2007 - 30 mai 2007 à 02:11
salut a tous, je developpe un moteur de recherche en C# ( en fait un portage depuis perl ), comme vous savez il existe différent encodage sur le web tel que utf-8, big5 etc... voila mon problème en perl j'utilise la puissante lib Encode afin de transcoder les pages non utf-8 en ce dernier, mon problème avec C# c'est que je n'ais pas trouvé d'équivalent la classe System.Text.Encoding ne fournit qu'un nombre limité d'encodage imaginé la mixture infecte obtenue en lisant une page encoder en Big5 en utf-8 :s.

Comment transcoder de disont Big5 a utf-8 sachant que Text.Encoding ne fournit pas big5 ?

Au pire je peut faire transcoder par perl mais bon :s

merci encore a vous

1 réponse

dirthangel Messages postés 19 Date d'inscription lundi 5 mai 2003 Statut Membre Dernière intervention 19 juin 2007
30 mai 2007 à 02:11
J'ai trouvé comment convertir d'un encodage a un autre :) , mais un problème demeure beaucoup de page web ne comporte pas de balise Content-Type aussi je voudrais savoir si il existe en .Net une fonction permettant de déterminer l'encodage d'un document en ce basant uniquement sur les bytes
0