Reconnaitre un fichier texte en UTF8

dheroux Messages postés 52 Date d'inscription vendredi 20 octobre 2006 Statut Membre Dernière intervention 11 juin 2014 - 11 juin 2014 à 06:47
cs_Jack Messages postés 14006 Date d'inscription samedi 29 décembre 2001 Statut Modérateur Dernière intervention 28 août 2015 - 20 juin 2014 à 01:47
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/100606-reconnaitre-un-fichier-texte-en-utf8

cs_Jack Messages postés 14006 Date d'inscription samedi 29 décembre 2001 Statut Modérateur Dernière intervention 28 août 2015 79
20 juin 2014 à 01:47
Dans ce genre de discution pleinement technique, mieux vaut parler en hexa, c'est plus logique.

Valeur des bytes du Preamble, pour info :
UTF-8 : EF BB BF
UTF-16 avec primauté des octets de poids fort (big-endian) : FE FF
UTF-16 avec primauté des octets de poids faible (little-endian) : FF FE
UTF-32 avec primauté des octets de poids fort (big-endian) : 00 00 FE FF
UTF-32 avec primauté des octets de poids faible (little-endian) : FF FE 00 00
cs_Warny Messages postés 473 Date d'inscription mercredi 7 août 2002 Statut Membre Dernière intervention 10 juin 2015
12 juin 2014 à 16:47
La bonne méthode consiste plutôt en ceci :
st.ReadByte() =239 and st.ReadByte() = 187 and st.ReadByte() = 191
Rejoignez-nous