Comparer les lignes de 2 fichiers text Résolu

Question

Bonjour, 
J'aimerais comparer les lignes de deux fichiers text. Mes fichiers possedes des lignes avec dedans un num&#233;ro de factures. Chaque fichier possede plus de 10000 lignes. En faites je voudrais verifier si les num&#233;ros de factures du premier fichier text se trouve dans le deuxieme, si les numeros du 2eme se trouve dans le premier, et si dans le deuxieme il n'y a pas de doublons. Je ne sais pas si j'ai bien expliqu&#233;.
Merci de votre aide.

neodelphi · Accepted Answer

Oubli pas de creer les stringlist:
list1 := TStringList.Create();

Euh sinon les "&#176;" il accepte le compilo ? Et si le fichier contiend plus de 10000 lignes &#231;a risque pas de plomber la m&#233;moire de les charger dans un stringlist ? il devrait etre possible de faire une lecture directement depuis le fichier, mais je croit que la m&#233;thode est l&#233;g&#232;rement plus compliqu&#233;e.

neodelphi

jlen100 · Answer

salut,

ouvre tes fichiers dans deux stringlist

de la premi&#232;re tu extrais  les  numeros de factures et tu  verifie  dans la seconde si le n&#233;mero est present

tu dois faire 2 boucles imbriqu&#233;es &#231;a devrait donner quelque chose comme &#231;a

list1.loadfromfile (nom du fichier 1 );//on charge les fichiers dans les listes

list2.loadfromfile (nom du fichier 2 );



for i:=  0  to  list1.count-1 do/ / on recherche le n&#176; de facture 

begin

    N&#176;Fac:  =copy(list1.items[i],x,y]);// je ne connais pas l'organisation de tes donn&#233;es

    present:=  false;

     for  j: =0 to list2.count-1 do //on recherche la pr&#233;sence dans la seconde liste 

      begin

            if (pos( N&#176;Fac,list2.items[j])<>0)then

            if present  then traitement du doublon else present: =true

     end;

    if not present then traitement pas de facture en liste2

end;

Dezouille · Answer

Merci pour ta reponse, en faite, si je comprend bien, on balaye a chaque fois toute la liste 2, tu me corrige si je me trompe. Car les listes ne sont pas trier. Se ne serais pas mieux de trier les liste sur les numeros de facture? J'aimerais que mon programme fasse une verification le plus rapidement possible.

Dezouille · Answer

Je suis d'accord avec Neodelphi, je pense qu'il faudrais mieux faire un lecture direct, mais l&#224; je ne voit pas tellement comment faire, si quelqun pouvait m'aider la dessus, se serait gentil, merci.

neodelphi · Answer

Je ne sais plus comment on fait, mais je pense que tu peut rechercher du cot&#233; des TFileStream (pas les TMemoryStream qui chargent en m&#233;moire le contenu du fichier, ce que tu veux &#233;viter).

Recherche sinon des sources sur le site je pense qu'il y en a pas mal.
voir exemple

neodelphi

jlen100 · Answer

salut neodelphi,

non le compilo n'accepte pas le '&#176;' c'&#233;tait juste pour facilit&#233; la lecture!!

pour la lecture directe il vaut mieux passer par l'ouverture d'un fichier texte normal

mais tu devras quand m&#234;me charger la seconde liste tu peux toutefois alleger la m&#233;moire en creant une liste de N&#176;.

tu fais 

var F1,F2:file;

buffer1,buffer2:string;

begin
list1 :=   TStringList.Create();

AssignFile(F1,FileName);

AssignFile(F2,FileName);


reset(F1);

reset(F2);

whille not eof(F2) do

begin


readln(F2,buffer2);

la tu extrait tes N&#176; et du les ajoutes &#224; list1: list1.append(n&#176;);

end;

puis pour les boucles

 while not eof (F1)  do/ / on recherche le n&#176; de facture 

 begin

    readln(F1,buffer1)

     N&#176;Fac:  =copy(buffer1);// je ne connais pas l'organisation de tes donn&#233;es

     present:=  false;

      for  j: =0 to list1.count-1 do //on recherche la pr&#233;sence dans la seconde liste 

       begin

             if (pos( N&#176;Fac,list2.items[j])<>0)then//nota on ne peut pas utiliser la fonction indexof qui ne retourne que la premiere occurence dommage !!

             if present  then traitement du doublon else present: =true

      end;

     if not present then traitement pas de facture en liste2

 end;

jlen100 · Answer

il y a une solution pour r&#233;duire la recherche au lieu d'utiliser une
variable string on peut utiliser une variable record et tu utilise des
pointeurs

type :

Spointeur:^Ppointeur;

Ppointeur:

record

numfac:string;

numligne:integer;

end;

var Plist2:Spoint;

dans la creation de la liste tu fais:

i:=0;// premier enregistrement;

 whille not eof(F2) do

 begin

new(Plist2);//tu cr&#233;e une entr&#233;e;

  readln(F2,buffer2);

 la tu extrait tes N&#176; -->

with Plist2 do 

begin
    numligne:=i;// tu m&#233;morises la ligne;
    numfac:=N&#176;;

end;
//tu les ajoutes &#224; list1:

 list1.add(Plist2);

 end;

ensuite quand tu as fais la recherche avant de sortir du traitement tu fais

dispose(Plist2);// pour liberer la memoire;

list1.delete(i);// tu supprimes l'entr&#233;e et tu diminue la longueur de la liste attention tu ne peux liberer les entrees que tu as parcouru toute la liste il faudra donc m&#233;moriser les entree a supprimer

ainsi la liste est r&#233;duite aux seules lignes qui n'ont pas &#233;t&#233; trait&#233;es.

Dezouille · Answer

Ok merci, je vais essayer tous &#231;a

jlen100 · Answer

c'est encore moi,

apr&#232;s avoir regard&#233; j'ai trouv&#233; le moyen d'utiliser indexof qui renvoie la prmier occurence trouv&#233;e

dans le recherche tu peux faire

while list2.indexof(N&#176;Fac)<>-1 do

begin

    j:= list2.indexof(N&#176;Fac);

    Plist2:=list2[i];//nota j'avais oublie l'affectattion: pas bien!!

     if no t present then 

    begin

        present: =true ;traitement de l'entree (tu as le N&#176; de ligne dans Plist2^.numligne)

    end else traitement du doublon;

    dispose(Plist2);// pour liberer la memoire;

    list1.delete(j);// tu supprimes l'entr&#233;e et tu diminues la longueur de la liste 

end;

le programme parcourt ainsi la liste jusqu'&#224; la fin et supprime les
occurences au fur et &#224; mesure. inconv&#233;nient il reprend le test depuis
le d&#233;but (bien que ce soit trasparent le traitement risque d'etre plus
long.

&#233;galement dans la constitution de la liste j'ai oubli&#233; d'incrementer i qui restera &#224; 0: pas facile de retrouver le N&#176; de ligne!!!

et dans with Plist2^ sinon le compilateur doit renvoyer une erreur decidement ce n'est pas mon jour!!

pour info sur un PC cadenc&#233; entre 2 et 3GHz le temps de traitement pour
10000 entr&#233;e  devrait se situer au alentour de 10s non compris le
traitement de l'info (~10ns par test) pour la derniere solution cela
dvrait tourner au alentour de 15 a 20s

jlen100 · Answer

tu peux encore am&#233;liorer la performance de l'ensemble en v&#233;rifiant s'il y a des doublons &#224; la cr&#233;ation de lits2 tu fais :

if list2.indexof(N&#176;)<>-1 then traitement du doublon;

dans ce cas le traitement ce r&#233;duira a 

while not eof (F1) do// on recherche le n&#176; de facture

  begin
     readln(F1,buffer1)
     N&#176;Fac:=   copy (buffer1);

      j: =list2.indexof(N&#176;Fac); // recherche de l'entr&#233;e 

    Plist2: = list2[i];

     if  j =-1 then traitement pas de facture en liste2

    else

    begin

        traitement;

        dispose(Plist2);// pour liberer la memoire;

        list1.delete(j);// tu supprimes l'entr&#233;e et tu diminues la longueur de la liste 

     end;

  end;

En s&#233;parant ainsi les 2 traitements on gagne d'une part en clart&#233; et
d'autre part en efficacit&#233; psuique la liste &#224; trait&#233;e ne contient plus
que des donn&#233;es valides

bonne prog

Dezouille · Answer

Merci beaucoup pour toutes ses infos precieuses, &#231;a a l'aire pas mal du tout

Comparer les lignes de 2 fichiers text

11 réponses

Votre réponse

Discussions similaires