Reconnaitre un fichier texte en UTF8

Signaler
Messages postés
52
Date d'inscription
vendredi 20 octobre 2006
Statut
Membre
Dernière intervention
11 juin 2014
-
cs_Jack
Messages postés
14008
Date d'inscription
samedi 29 décembre 2001
Statut
Modérateur
Dernière intervention
28 août 2015
-
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/100606-reconnaitre-un-fichier-texte-en-utf8

cs_Jack
Messages postés
14008
Date d'inscription
samedi 29 décembre 2001
Statut
Modérateur
Dernière intervention
28 août 2015
63
Dans ce genre de discution pleinement technique, mieux vaut parler en hexa, c'est plus logique.

Valeur des bytes du Preamble, pour info :
UTF-8 : EF BB BF
UTF-16 avec primauté des octets de poids fort (big-endian) : FE FF
UTF-16 avec primauté des octets de poids faible (little-endian) : FF FE
UTF-32 avec primauté des octets de poids fort (big-endian) : 00 00 FE FF
UTF-32 avec primauté des octets de poids faible (little-endian) : FF FE 00 00
cs_Warny
Messages postés
478
Date d'inscription
mercredi 7 août 2002
Statut
Membre
Dernière intervention
10 juin 2015

La bonne méthode consiste plutôt en ceci :
st.ReadByte() =239 and st.ReadByte() = 187 and st.ReadByte() = 191