Souci avec ReadLine (StreamReader)Résolu

Question

Salut,



je voudrais extraire une partie d'un fichier txt qui se trouve au
milieu de ce dernier. Seul moyen d'identifier la partie en question, le
d&#233;but des lignes est connu.



Par exemple, le fichier ressemble &#224; ceci :



debut1...

debut2...

debut3...

milieu1...

milieu2...

milieu3...



milieu4...



fin1...

fin2...

fin3...


Je me sers pour l'instant de l'algo suivant pour extraire la partie qui
commence par milieu, mais ce n'est pas satisfaisant, il me manque la
premi&#232;re ligne qui commence par "milieu" :



                try 

                {

           
        using (StreamReader sr = new
StreamReader(File_Name)) 

                    {

                        string line;

           
            while
((line=sr.ReadLine()).StartsWith("ENTET"))

                        {

           
           
    string_DEFETAT = "";

                        }

           
            while
(!(line=sr.ReadLine()).StartsWith("MES"))

                        {

           
           
    string_DEFETAT +=line + "
";

                        }

                        sr.Close();

                    }

                }



Ce code me donne :


milieu2...

milieu3...



milieu4...




J'ai essay&#233; un autre code qui me donne :


milieu1...

milieu3...






Mais je n'arrive pas &#224; avoir tout ce qui commence par
milieu. Si vous voulez bien m'aider, je sais que c pas dur, mais bon,
quand on bloque.. on bloque

Lutinore · Accepted Answer

Salut, c'est &#231;a que tu essayes de faire ?

string s = string.Empty;
string line = string.Empty;
sr = new StreamReader( "Test.txt" );


while( ( line = sr.ReadLine( ) ) != null )
{
    if ( line.StartsWith( "milieu" ) )
        s += line + "
";
}


//MessageBox.Show( s );


sr.Close( );

el_teedee · Answer

try 
                 {

           
        using (StreamReader sr = new
StreamReader(File_Name)) 
                     {
                         string line;

           
            while
((line=sr.ReadLine()).StartsWith("debut"))
                         {

           
           
    string_DEFETAT = "";
                         }

           
            while
(!(line=sr.ReadLine()).StartsWith("fin"))
                         {

           
           
    string_DEFETAT +=line + "
";
                         }
                         sr.Close();
                     }
                 }
C'est plut&#244;t ca l'algo dans le cas de l'exemple :-)

sebmafate · Answer

si tu connais le d&#233;but de la ligne, pourquoi ne pas utiliser une expression r&#233;guli&#232;re ?


<HR>
S&#233;bastien FERRAND

Blog : http://blogs.developpeur.org/sebmafate

el_teedee · Answer

Hmmm, c koi une expression r&#233;guli&#232;re ?



Sinon, j'ai trouv&#233; une solution, mais c de la bidouille je pense ...

                 try 
                 {

           
        using (StreamReader sr =  new
StreamReader(File_Name)) 
                     {
                         string line;

           
            while
((line=sr.ReadLine()).StartsWith("debut"))
                         {

           
           
    string_DEFETAT = "";
                         }

                          string_DEFETAT = line ; 

    
           
        while
(!(line =sr.ReadLine()).StartsWith("fin"))
                         {

           
           
    string_DEFETAT +=line + "
";
                         }
                         sr.Close();
                     }
                 }

Ca me rajoute bien la premi&#232;re ligne que je n'arrivais pas &#224; avoir...



>Seb : je veux bien que tu montres une meilleure m&#233;thode si tu as 5 min

el_teedee · Answer

Apparemment, c'est une sorte de masque ? Si tu veux bien me montrer ce que ca donnerait dans mon cas, je suis preneur...

sebmafate · Answer

en fait, tu charges ton fichier dans une string (ReadToEnd())
ensuite, tu utilises une expression r&#233;guli&#232;re qui te retournera l'ensemble des lignes qui correspondent.
par exemple :

System.Text.RegularExpressions.Regex regex = 

   new System.Text.RegularExpressions.Regex(
"^debut");

regex.Matches(fichier)

te retourne une collections de Match contenant toutes  les lignes qui commence par "debut".

Je te conseille de lire la doc pour en connaitre un peu plus sur les expressions r&#233;guli&#232;res : http://msdn.microsoft.com/library/fre/default.asp?url=/library/FRE/cpref/html/frlrfsystemtextregularexpressionsregexclasstopic.asp


<HR>
S&#233;bastien FERRAND

Blog : http://blogs.developpeur.org/sebmafate

el_teedee · Answer

>Seb, j'ai un petit doute, j'ai test&#233; ta solution mais ca ne marche
pas, et je suppose que cela vient, en partie, du fichier, et en autre
partie de la syntaxe.

En effet, c'est moi qui ai cr&#233;e les fichiers dans lesquels je
recherche, et ces fichiers en question n'ont que 
 &#224; la fin de la
ligne et non pas 
.

Puisque je veux l'ensemble de toutes les lignes qui commencent par le
texte recherch&#233;, est-ce qu'il ne faut pas qu'il y ait plut&#244;t 
 &#224; la
fin des lignes pour qu'il prenne &#231;a comme des vrais fin de ligne ?

Car quand j'ouvre mon fichier avec textpad, tout est coll&#233;, alors qu'avec wordpad, il affiche bien les sauts de lignes.



Sinon, j'ai donc essay&#233; ceci :

                System.Text.RegularExpressions.Regex regex = 

           
        new
System.Text.RegularExpressions.Regex("^milieu");

                try 

                {

           
        using (StreamReader sr = new
StreamReader(File_Name)) 

                    {

           
            fichier =
sr.ReadToEnd();

           
           
System.Text.RegularExpressions.MatchCollection a =

           
           
    regex.Matches(fichier);

           
            foreach
(System.Text.RegularExpressions.Match valeur in a)

                        {

           
           
    resultat += valeur;

                        }

                    }

                }
Cela ne me retourne rien.

Avec ceci comme regex :

 System.Text.RegularExpressions.Regex regex = 

           
        new
System.Text.RegularExpressions.Regex("^debut");

cela me retourne 1 match qui est "debut" tout court, sans la phrase derri&#232;re.



N'y a t-il pas un probl&#232;me au niveau de la syntaxe ^milieu ?
D'une part, parcequ'il ne va pas le chercher au milieu du texte
apparemment, et d'autre part, parcequ'il ne retourne pas aussi le
contenu de la phrase enti&#232;re.



>Lutinore : j'ai test&#233; ton code ci dessus, apparemment, ca marche
impeccable, maintenant reste &#224; savoir laquelle des deux m&#233;thodes est la
plus rapide  (les fichiers vont de qqls ko &#224; disons 500Ko)



Mais pour l'instant, je n'ai pas trouv&#233; la m&#233;thode avec regex donc je v m'orient&#233; vers ta m&#233;thode Lutinore.

sebmafate · Answer

je me suis tromp&#233; dans l'expression r&#233;guli&#232;re 

"^milieu\w*$" et ajouter l'option RegexOptions.Multiline

S&#233;bastien FERRAND

sebmafate · Answer

d&#233;cid&#233;ment... "^milieu.*$"


<HR>
S&#233;bastien FERRAND

Blog :

el_teedee · Answer

J'ai du rajouter un @ devant "^milieu\w*$" car il me dit s&#233;quence
d'&#233;chappement non reconnue (mais ca me retourne quand meme 0 match). Tu
n'aurais pas encore oubli&#233; un pitit truc ?

el_teedee · Answer

J'ai aussi essay&#233; de doubler le \, car je me rappelle avoir vu ca un coup, mais ca ne marche pas non plus :-/

c&#224;d : "^milieu\w*$"

el_teedee · Answer

Bon, j'avais pas vu ton dernier post. Sinon, je serais d'accord avec
toi pour ".*" qui compte autant de car qu'il faut pour aller &#224; $ qui
est la fin de la ligne, mais ca ne marche pas. Est-ce que tu penses pas
que ca vienne de mon fichier qui n'a que des 
 et pas des 
 ?

sebmafate · Answer

essaye celle-ci : "^milieu.*$"

S&#233;bastien FERRAND

sebmafate · Answer

c'est possible... dans ce cas, sur ta chaine fait un .Replace("
","
")

S&#233;bastien FERRAND

el_teedee · Answer

Bon suite &#224; mes quelques tests (pour vous d&#233;partager, lol 
), j'ai obtenu les r&#233;sultats suivants, qu'il faut interpr&#233;ter avec
pr&#233;caution, car les r&#233;sultats sont variables d'un test &#224; l'autre et
aussi si on r&#233;p&#232;te plein de fois le test (ca c mon programme qui est
mal fait, c'est autre chose ) :



Le test consistait &#224; retourner 95% du fichier : (car 95% commence par le m&#234;me mot) :

fichier de 90ko :
m&#233;thode readline : environ 2300 ms

m&#233;thode regex : de 40 &#224; 50 ms environ



fichier de 59ko :

m&#233;thode readline : environ 1300 ms


m&#233;thode regex : de 10 &#224; 50 ms environ



Voil&#224; pour clore ce sujet, Regex est &#233;norm&#233;ment plus rapide que la lecture par Readline(). 

Merci de votre aide...

el_teedee · Answer

Bon je pensais avoir mis la solution avant mon pr&#233;c&#233;dent post, mais le
site rame tellement &#224; ma bo&#238;te, que le post n'est pas pass&#233; apparemment.

Je pr&#233;cisais que les deux m&#233;thodes marchaient, et que j'allais faire des tests pour voir la plus rapide :



voil&#224; le code qui marche, il fallait bien pr&#233;ciser l'option "multiline" lors de la cr&#233;ation de l'objet regex :



                System.Text.RegularExpressions.RegexOptions Option = 

           
       
System.Text.RegularExpressions.RegexOptions.Multiline;

                System.Text.RegularExpressions.Regex regex = 

           
        new
System.Text.RegularExpressions.Regex("^DEFETAT.*$",Option);

                

                try 

                {

           
        using (StreamReader sr = new
StreamReader(File_Name)) 

                    {

           
            fichier =
sr.ReadToEnd();

           
           
System.Text.RegularExpressions.MatchCollection a =

           
           
    regex.Matches(fichier);

           
            foreach
(System.Text.RegularExpressions.Match valeur in a)

                        {

           
           
    resultat += valeur;

                        }

                    }

                }

sebmafate · Answer

Merci pour ces precisions.

S&#233;bastien FERRAND

el_teedee · Answer

Quand &#224; faire, j'aimerais am&#233;liorer mon code. Je suis sur que je peux
encore acc&#233;l&#233;rer cette routine, car j'utilise un string pour stocker
l'ensemble des match trouv&#233;s.

resultat += valeur;

Je me rappelle que l'on m'avait d&#233;j&#224; conseill&#233; de faire gaffe avec
l'utilisation de string dans ce cas pr&#233;cis (o&#249; je stocke au fur et &#224;
mesure une importante quantit&#233;).



Vous qui connaissez sans doute mieux que moi les objets que propose la
classe text, ou une autre classe, il n'y aurait pas mieux &#224; faire, avec
je sais pas un streamreader, ou un autre objet dans le style qui serait
mieux appropri&#233; &#224; stocker une phrase assez longue (genre 90Ko) ?

sebmafate · Answer

Utilise un StringBuilder, dans System.Text.

S&#233;bastien FERRAND

Lutinore · Answer

C'est ReadToEnd qui est plus rapide qu'une boucle avec ReadLine. Et les m&#233;thodes de la classe String c'est pas terrible au niveau des perfs..

Souci avec ReadLine (StreamReader)

20 réponses

Votre réponse

Discussions similaires