inac
Messages postés3Date d'inscriptionmercredi 19 mai 2004StatutMembreDernière intervention13 juillet 2005
-
13 juil. 2005 à 03:19
mythic_kruger
Messages postés241Date d'inscriptionjeudi 8 janvier 2004StatutMembreDernière intervention10 novembre 2005
-
14 juil. 2005 à 04:43
Ciao Tutti,
Je vous explique mon problème, je suis entrain de travaillé sur une
étude appliquant des méthodes de Data Mining, à la detection
d'intrusion, cependant jai un problème dans mon étude, quand on fé du
Data Mining, les fichiers que l'on utilise doivent etre au meme format.
Je désire donc codé un ptit truc(en c# c'est plus sexy), qui me
prend pas exemple un fichier Log d'un firewall et un autre d'un IDS,
puis ensuite poduit un autre fichier regroupant les 2 logs précédent,
mais dans un format que jai défini et seulement avec les infos que jai
décidé (ex, je decide juste de gardé IP souce/ destination, duré de la
connection, Port et la taille du packet) le reste je le jette.
J'aimerais donc savoir, si vous avé une idée de comment faire, je ne
pense pas que ca doit etre qqchose de bien sorcier, mais je suis une
quiche en code, donc un peu d'aide ne me fera variemnt pas de mal
ps: le but étant de faire ca pour un nombre n de fichiers log, pour mettre tout dans un seul.
mythic_kruger
Messages postés241Date d'inscriptionjeudi 8 janvier 2004StatutMembreDernière intervention10 novembre 2005 14 juil. 2005 à 04:43
Le processus en lui-même fait plus appel au bon sens qu'aux études en informatique.
C'est la mise en application d'un concept, par conséquent un phénomène
indépendant du langage. Qui plus une dll en C appelée depuis VB en
déclarant les fonctions dans un module n'est pas si rare après tout.
S.W.A.T.
Le code, qu'il fut en VB ou en C, dut en théorie lire le fichier ligne par ligne, pour
1* décomposer chaque ligne et sortir les valeurs qui intéressent (VB
fait ça bien avec la fonction Split() mais libre à toi de scanner la
ligne caractère par caractère surtout si tu préfères le C),
2* concaténer la nouvelle ligne, et
3* écrire cette ligne dans le fichier de destination.
Si j'ai bien compris il faudra appeler n fois cette fonction pour traiter n fichiers à la suite. Facile non?
Dans tous les cas tu dois connaître sinon établir le formatage des log:
celui des logs source et celui du log que tu vas écrire; notamment le
caractère délimiteur. La plupart des logs ont un format propriétaire,
un simple split ne suffit plus...
Conseil d'ami si tu débutes dans ce domaine: le format CSV, c'est un
standard. Le caractère délimiteur est un point virgule (si tu savais
tant mieux moi je sais pas).
Mais attention dans le choix du délimiteur: en effet la structure
du log est sus-jascente aux opérations ultérieures d' analyse du log,
en conséquence de quoi il faut toujours privilégier les performances
par des actions simples.
Ne pas se lancer dans l' écriture d'une dll si les logs font moins de 32Ko parce que VB se convient à lui-même dans ce domaine.
Qui nous montre une utilisation de la fonction Split() ?