Transformer des fichiers Log en un format commum

inac Messages postés 3 Date d'inscription mercredi 19 mai 2004 Statut Membre Dernière intervention 13 juillet 2005 - 13 juil. 2005 à 03:19
mythic_kruger Messages postés 241 Date d'inscription jeudi 8 janvier 2004 Statut Membre Dernière intervention 10 novembre 2005 - 14 juil. 2005 à 04:43
Ciao Tutti,



Je vous explique mon problème, je suis entrain de travaillé sur une
étude appliquant des méthodes de Data Mining, à la detection
d'intrusion, cependant jai un problème dans mon étude, quand on fé du
Data Mining, les fichiers que l'on utilise doivent etre au meme format.



Je désire donc codé un ptit truc(en c# c'est plus sexy), qui me
prend pas exemple un fichier Log d'un firewall et un autre d'un IDS,
puis ensuite poduit un autre fichier regroupant les 2 logs précédent,
mais dans un format que jai défini et seulement avec les infos que jai
décidé (ex, je decide juste de gardé IP souce/ destination, duré de la
connection, Port et la taille du packet) le reste je le jette.


J'aimerais donc savoir, si vous avé une idée de comment faire, je ne
pense pas que ca doit etre qqchose de bien sorcier, mais je suis une
quiche en code, donc un peu d'aide ne me fera variemnt pas de mal



ps: le but étant de faire ca pour un nombre n de fichiers log, pour mettre tout dans un seul.

2 réponses

econs Messages postés 4030 Date d'inscription mardi 13 mai 2003 Statut Modérateur Dernière intervention 23 décembre 2008 23
13 juil. 2005 à 09:16
> Je désire donc codé un ptit truc(en c# c'est plus sexy)



Pourquoi alors ne pas poser ta question sur :

http://www.CSharpFR.com



C'est un forum dédié au C#. Ca sera quand même plus pratique qu'un forum dédié au Visual Basic. Non ?




Manu
-------------------------------------------
Une question bien posée, c'est une chance de réponse bien adaptée.
0
mythic_kruger Messages postés 241 Date d'inscription jeudi 8 janvier 2004 Statut Membre Dernière intervention 10 novembre 2005
14 juil. 2005 à 04:43
Le processus en lui-même fait plus appel au bon sens qu'aux études en informatique.



C'est la mise en application d'un concept, par conséquent un phénomène
indépendant du langage. Qui plus une dll en C appelée depuis VB en
déclarant les fonctions dans un module n'est pas si rare après tout.



S.W.A.T.




Le code, qu'il fut en VB ou en C, dut en théorie lire le fichier ligne par ligne, pour

1* décomposer chaque ligne et sortir les valeurs qui intéressent (VB
fait ça bien avec la fonction Split() mais libre à toi de scanner la
ligne caractère par caractère surtout si tu préfères le C),

2* concaténer la nouvelle ligne, et

3* écrire cette ligne dans le fichier de destination.



Si j'ai bien compris il faudra appeler n fois cette fonction pour traiter n fichiers à la suite. Facile non?



Dans tous les cas tu dois connaître sinon établir le formatage des log:
celui des logs source et celui du log que tu vas écrire; notamment le
caractère délimiteur. La plupart des logs ont un format propriétaire,
un simple split ne suffit plus...



Conseil d'ami si tu débutes dans ce domaine: le format CSV, c'est un
standard. Le caractère délimiteur est un point virgule (si tu savais
tant mieux moi je sais pas).

Ton business deviendrait

IPSource;IPDestination;DuréeConnection;Port;Volume;

Mais attention dans le choix du délimiteur: en effet la structure
du log est sus-jascente aux opérations ultérieures d' analyse du log,
en conséquence de quoi il faut toujours privilégier les performances
par des actions simples.



Ne pas se lancer dans l' écriture d'une dll si les logs font moins de 32Ko parce que VB se convient à lui-même dans ce domaine.

Qui nous montre une utilisation de la fonction Split() ?
0