vallytiana
Messages postés25Date d'inscriptionlundi 1 mars 2010StatutMembreDernière intervention 9 juin 2006
-
31 mai 2006 à 14:35
Twinuts
Messages postés5375Date d'inscriptiondimanche 4 mai 2003StatutModérateurDernière intervention14 juin 2023
-
9 juin 2006 à 17:41
Bonjour,
Voici mon problème et je suis une débutante en Java,
J'ai un répertoire qui contient plusieurs CV word. Le but étant de pourvoir récupérer toutes les adresses e-mails qui se trouvent dans chaque CV et de les stocker ensuite sur un autre fichier (txt ou doc ou n'importe quoi).
Pour le moment, je suis bloquée à 100%. Merci beaucoup!!!!
Twinuts
Messages postés5375Date d'inscriptiondimanche 4 mai 2003StatutModérateurDernière intervention14 juin 2023111 31 mai 2006 à 16:00
Salut,
pour la lecture et/ou ecriture de données dans des fichiers word ou
autres formats foireux made in crosoft en java tu dois passer par une
api externe (ou t'en faire une mais la faut commencer par une formation
sur les standards crosoft).
en api tu peux utiliser POI (made in apache), ou passer directement par les api oO (openOffice) qui comme POI respecte réellement l'open document (OASIS)
vallytiana
Messages postés25Date d'inscriptionlundi 1 mars 2010StatutMembreDernière intervention 9 juin 2006 31 mai 2006 à 16:14
je ne comprends rien de ce que vous dites.
n'y a-t-il pas un moyen de faire un simple code pour faire l'algorithme suivant:
1- accéder au répertoire
2- récupérer le nom des fichiers ".doc" et les mettres dans un tableau
3- fonction récolter mail
Pour chaque fichier du tableau
{
- chercher l'adresse mail dans ce fichier
- stocker ce mail dans un fichier ".txt" par exemple
} (ainsi de suite)
En sortie, on a un fichier avec une liste de mails!!!!!!!!!
vallytiana
Messages postés25Date d'inscriptionlundi 1 mars 2010StatutMembreDernière intervention 9 juin 2006 31 mai 2006 à 16:22
ce n'est donc pas possible de faire un simple openfile (vu que le file ici c'est word) et de parcourir chaque bit??? on m'a dit que c'est faisable en ".txt"
ou est-ce que le gros du problème c'est la récupération de la liste des fichiers????
à quoi sert cet api exactement et c'est quoi un api????????
sheorogath
Messages postés2448Date d'inscriptionsamedi 21 février 2004StatutModérateurDernière intervention29 janvier 201017 31 mai 2006 à 16:24
fait comme twinuts te dit essai d'ouvrir un doc avec notepad et tu comprendras
une api est une bibliotheque que t'ajoute pour beneficier de ses fonctions
"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
HSylvio
Messages postés116Date d'inscriptionjeudi 22 juillet 2004StatutMembreDernière intervention14 juin 2012 31 mai 2006 à 16:39
Comme on te l'a dit, c'est possible et très facile avec un .txt parce qu'il n'y a que du texte dans un
.txt.
Maintenant si tu ouvres un fichier enregistré par word tu verras plein de caracrères bizzares, et pas de texte compréhensible car ces fichiers contiennent plein d'informations de mise en forme, couleurs, polices etc... et utilisent pour ce un code qui n'est pas le meme que l'ASCII par exemple.
C'est pour cela que tu dois utiliser une API, ensemble de classes/fonctions, qui te permettra de récupérer le TEXTE des document .doc ; TEXTE dans lequel tu chercheras les @ pour la récupération de l'adresse e-mail.
Ceci n'est utile que pour la partie 3.A
1- accéder au répertoire // ca devrait aller, utilises un JFileChooser
2- récupérer le nom des fichiers ".doc" et les mettres dans un tableau // facile pour toi....
3- fonction récolter mail
Pour chaque fichier du tableau
{
A- RECUPERER LE TEXTE DES DOCUMENTS!!! // tu n'avais pas pensé a ça mais c ce kon texplique
B- chercher l'adresse mail dans ce fichier // commence par chercher @ puis cherches retourligne ou espace avant et apres
C- stocker ce mail dans un fichier ".txt" par exemple // quand tu en seras là ca sera du space cake !!!
} (ainsi de suite)
Voila ben j'te conseille des tutoriaux (sur ce site par ex.) pour lire/ecrire dans les fichiers;
Sinon j'écouterai WORA pour le nom de l'api à ta place...
Bonne prog.
HSylvio
Messages postés116Date d'inscriptionjeudi 22 juillet 2004StatutMembreDernière intervention14 juin 2012 1 juin 2006 à 14:16
Ah ben voila du travail de papa!!!
Toutefois j'ai trouvé une erreur fort remarquable :
(... c'est pas c'te faute là qui va te poser pb longtemps ...)
public classe OpenFileChooser{
Ben alors on a meme pas fait du ctrl+C - ctrl+V ?!?
( desole Valitianna mais bon si j'etait un gros gay j'lui mangerai bien la cacahuete à tonton Twinuts...
... d'ailleurs il a deja fait les 3/4 de ton travail; ca mériterai bien, non??)
vallytiana
Messages postés25Date d'inscriptionlundi 1 mars 2010StatutMembreDernière intervention 9 juin 2006 2 juin 2006 à 14:59
J'ai réussi à trouver ça pour lister les fichiers dans un répertoire et je cherche comment faire avec seulement les ".doc"
import java.io.File;
public class FilenameFilter{
public static void main(String args[]){
try{
File dir = new File("C:\\CVWORD");
String[] children = dir.list();
if (children == null) {
System.out.println("Directory does not exist or is not a Directory");
}
else {
for (int i=0; i<children.length; i++){ // Get filename of file or directory
String filename = children[i];
System.out.println(filename);
}
}
}
catch (Exception ioe){
ioe.printStackTrace();
}
}
}