choix du structure des données

boualiasma Messages postés 393 Date d'inscription lundi 22 juin 2009 Statut Membre Dernière intervention 23 décembre 2011 - 1 nov. 2009 à 16:13
boualiasma Messages postés 393 Date d'inscription lundi 22 juin 2009 Statut Membre Dernière intervention 23 décembre 2011 - 3 nov. 2009 à 06:59
Bonjour,

Je vais refaire une grande partie de mon travail car j'ai mal choisi
les structures des données car les accès fichiers sont plus coûteux.
Tout mon travail se base sur les fichiers même les résultats
intermédiaires. Le but de mon travail est de trouver une solution à mon problème mais de plus minimiser le plus possible le temps
d'exécution (le mesure le temps en utilisant la fonction 'clock()'.

Mais, lorsque j'ai testé le temps de l'exécution concernant la comparaison de deux fichiers selon les critères bien définis alors
j'ai remarqué que le temps est devenir très longue si nous avons des fichiers avec des centaines lignes.

On va lire chaque ligne de fichier 1 et le compare avec tous les lignes de fichier 2. C'est très couteux.

D'après vous :
- Avec quelles structures des données ces deux fichiers seront
remplacés ?

- En général,quelle est la structure des données la moins couteuse en
mémoire et donc temps d'exécution le plus inférieur possible ?

Je souhaite que vous m'aidez.

Merci.

3 réponses

boualiasma Messages postés 393 Date d'inscription lundi 22 juin 2009 Statut Membre Dernière intervention 23 décembre 2011 5
1 nov. 2009 à 18:05
Bonjour,

Dans mon programme C, la fonction de comparaison est :
*rets = compare_files("f.txt", "f2.txt");


Je passe deux fichiers "f.txt" et "f2.txt" à la fonction 'compare_files'
la taille de "f.txt" est toujours plus grande que "f2.txt".
chaque ligne de deux fichiers contient une chaine de caractère.

Je cherche les lignes qui appartiennent à "f.txt" et non pas "f2.txt"
C'est une sorte de différence lignes de "f.txt" moins lignes de "f2.txt"
à condition:
Une ligne de "f.txt" est identique à une ligne de "f2.txt"
si les deux lignes ont la même valeur et le même nombre des mots qui forment les deux lignes quelque soit l'ordre des mots puisque l'ordre des mots n'est pas important dans mon problème.
le plus important c'est : la même valeur et le même nombre

Sinon c'est à dire les deux lignes n'ont pas la même valeur et le même nombre des mots alors dans ce cas les deux lignes sont différentes.

par exemple:
"nom prenom age" = "nom age prenom"


Sachant que chaque ligne du deux fichiers "f.txt" et "f2.txt" est composé d'un seul champ (une chaine de caractères)

Soit le premier fichier fichier "f.txt":
<citation>nom prenom
nom age
prenom age
prenom emploi
nom prenom age
nom emploi
age emploi
prenom age emploi
nom age emploi
nom prenom emploi
nom prenom age emploi
</citation>

Soit le deuxième fichier "f2.txt":
<citation>nom
prenom
age
emploi
age nom
nom age prenom
nom emploi
age emploi
prenom age emploi
nom prenom emploi</citation>


On applique le principe de comparaison alors on obtient ce résultat intermédiaire:
<citation>nom prenom
nom age emploi
nom prenom age emploi</citation>

Puis, on garde de ce résultat que les chaines qui ne contiennent pas autre chaine de ce résultat.
ici, on ne garde pas la chaine "nom prenom age emploi" car elle contienne la chaine "nom prenom"

Le résultat final souhaité obtenu est :
<citation>nom prenom
nom age emploi</citation>

Que proposez vous ?

Merci.
0
boualiasma Messages postés 393 Date d'inscription lundi 22 juin 2009 Statut Membre Dernière intervention 23 décembre 2011 5
1 nov. 2009 à 18:07
Bonjour,

Dans mon programme C, la fonction de comparaison est :
*rets = compare_files("f.txt", "f2.txt");


Je passe deux fichiers "f.txt" et "f2.txt" à la fonction 'compare_files'
la taille de "f.txt" est toujours plus grande que "f2.txt".
chaque ligne de deux fichiers contient une chaine de caractère.

Je cherche les lignes qui appartiennent à "f.txt" et non pas "f2.txt"
C'est une sorte de différence lignes de "f.txt" moins lignes de "f2.txt"
à condition:
Une ligne de "f.txt" est identique à une ligne de "f2.txt"
si les deux lignes ont la même valeur et le même nombre des mots qui forment les deux lignes quelque soit l'ordre des mots puisque l'ordre des mots n'est pas important dans mon problème.
le plus important c'est : la même valeur et le même nombre

Sinon c'est à dire les deux lignes n'ont pas la même valeur et le même nombre des mots alors dans ce cas les deux lignes sont différentes.

par exemple:
"nom prenom age" = "nom age prenom"


Sachant que chaque ligne du deux fichiers "f.txt" et "f2.txt" est composé d'un seul champ (une chaine de caractères)

Soit le premier fichier fichier "f.txt":
nom prenom
nom age
prenom age
prenom emploi
nom prenom age
nom emploi
age emploi
prenom age emploi
nom age emploi
nom prenom emploi
nom prenom age emploi


Soit le deuxième fichier "f2.txt":
nom
prenom
age
emploi
age nom
nom age prenom
nom emploi
age emploi
prenom age emploi
nom prenom emploi



On applique le principe de comparaison alors on obtient ce résultat intermédiaire:
nom prenom
nom age emploi
nom prenom age emploi

Puis, on garde de ce résultat que les chaines qui ne contiennent pas autre chaine de ce résultat.
ici, on ne garde pas la chaine "nom prenom age emploi" car elle contienne la chaine "nom prenom"

Le résultat final souhaité obtenu est :
nom prenom
nom age emploi


Que proposez vous ?

Merci.
0
boualiasma Messages postés 393 Date d'inscription lundi 22 juin 2009 Statut Membre Dernière intervention 23 décembre 2011 5
3 nov. 2009 à 06:59
Bonjour,

J'ai besoin vos aides. Si ma demande n'est pas claire alors je vous explique de nouveau ma demande.

C'est vraie que ce code donne la solution mais il n'est pas rapide vu il y a accès de lecture de deux fichiers qui peuvent contenir des centaines des lignes.

Je voulais travailler tout en mémoire pour obtenir un temps d'exécution le moins possible alors comment faire ?

J'utilise la fonction 'clock()' pour mesurer ce temps. Je ne sais pas si c'est un bon choix ou non ?

Que proposez vous ?

Merci.
0
Rejoignez-nous