Compression de chaine

Soyez le premier à donner votre avis sur cette source.

Vue 7 809 fois - Téléchargée 155 fois

Description

Voilà, c'est un petit script de compression, pas très au point mais c'est fait pour être amélioré.
Ca marche comme ça :
on veut coder dodododododododododododododo par exemple.
"d" est la lettre n°100 et "o" la lettre n°111.
la lettre la plus basse du texte est la lettre "d" (n°100)(variable start).
l'"amplitude" de la chaine est donc de 11 et le chiffre 11 se code 10011 (sur 5 bits). donc la variable amp sera de 5.
ensuite on prend chaque lettre du texte : d = 100 ; a partir de 100, 100 est le premier nombre sur 11 : 00000 on rajoute les zéros nécessaires ; on l'ajoute a la chaine de bits (nbstring);
o = 111 ; 11eme/11 ; 10011 ; aucun zéro nécessaire; on l'ajoute a la chaine.
ensuite on prend chaque groupe de 8 bits et si le dernier groupe n'est pas complet on lui rajoute des zéros :[00000100]111+00000
on code chaque groupe de 8bits en un caractère (on va dire que ce groupe fait Y et le deuxième b par exemple) : YYYYYYYYYYYYB
plus l'amplitude et le départ : d♣YYYYYYYYYYYB
on gagne des caractères.

pour décompresser : on prend le premier caractère et le deuxième, on les décode : start = 100, amp = 5;
ensuite on convertit tout le texte en chaine de bits, on prend chaque groupe de 1*amp bits (ici c'est 5 bits), et on les code sur 1*amp bits (5) et on obtient une valeur decadécimale du caractère a partir de start. on l'ajoute a start et on trouve alors le code ascii du caractère. on le reconverti en caractère et on obtient la chaine du début (sauf le dernier caractère qui est parfois faux s'il a été complété).

Source / Exemple :


Chaine claire.<br>
<textarea id="0" onkeyUp="document.getElementById(1).value=compress(this.value);document.getElementById(2).value=decompress(compress(this.value));document.getElementById(3).value=this.value.length-compress(this.value).length">

</textarea><br><br>
Chaine compressée.<br>
<textarea id="1">

</textarea><br><br>
Chaine décompréssée.<br>
<textarea id="2">

</textarea><br><br>
Caractères gagnés.<br>
<input type="text" id="3">
<script>
function compress(text)
{
var ranked=text.split("").sort();
var start=ranked[0].charCodeAt(0);
var amp=(ranked[ranked.length-1].charCodeAt(0)-ranked[0].charCodeAt(0)).toString(2).length;
var compstr=String.fromCharCode(start)+String.fromCharCode(amp);
var nbstr="";
var nb="";
var zeros="";

for(j=0;j<text.length;j++)
{
zeros="";
nb=(text.charCodeAt(j)-start).toString(2);
for(k=0;k<(amp-nb.length);k++){zeros+="0";}
nbstr+=zeros+nb+"";
}
while(Math.round(nbstr.length/8)*8!=nbstr.length)
{
nbstr+="0";
}
for(l=0;l<nbstr.length;l+=8)
{
compstr+=String.fromCharCode(parseInt(nbstr.substring(l,l+8),2));
}
return compstr;
}

function decompress(text)
{
var start=text.charCodeAt(0);
var amp=text.charCodeAt(1);
var decompstr="";
var nbstr="";
var nb="";
var zeros="";
text=text.substring(2,text.length);
for(i=0;i<text.length;i++)
{
zeros="";
nb=text.charCodeAt(i).toString(2);
for(k=0;k<(8-nb.length);k++){zeros+="0";}
nbstr+=zeros+nb+"";
}

for(j=0;j<nbstr.length;j+=amp)
{
decompstr+=String.fromCharCode(parseInt(nbstr.substring(j,j+amp),2)+start);
}
return decompstr.substring(0,decompstr.length-2);
}
</script>

Conclusion :


Voilà. des suggestions ?

Codes Sources

A voir également

Ajouter un commentaire

Commentaires

Messages postés
450
Date d'inscription
samedi 16 avril 2005
Statut
Membre
Dernière intervention
18 avril 2007
2
Oui, et au pire on retombe sur la m¨ºme longueur +3 caract¨¨res (pour la d¨¦finition au d¨¦but de la chaine.)
<quote>
Un petit bug: le dernier caract¨¨re est souvent perdu lors du d¨¦codage.
</quote>
d¨¦ja expliqu¨¦. il faudrais peut-¨ºtre dans ce cas encoder le dernier caract¨¨re normalement, et dire au programme de ne d¨¦coder que le dernier caract¨¨re normalement. aussi, un truc, tapez Alt+1 (☺) et Alt+254 (¡ö), et alors l¨¤ m¨ºme en en tapans que la meme lettre apr¨¨s, vous trouverez toujours une longeur sup¨¦rieure :
¡ö☺aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
sera toujours plus long que bcaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa.

Stfou
Messages postés
8
Date d'inscription
mercredi 1 janvier 2003
Statut
Membre
Dernière intervention
8 mars 2007

Bonjour, la technique utilisée est intéressante, au plus la chaîne est longue au plus c'est efficace.

Un petit bug: le dernier caractère est souvent perdu lors du décodage.

Jilube (http://www.ilu.be)

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.