Base de donnée wiki

Description

Cette source permet de traiter le fichier xml de wiktionary d'environ 500Mo pour en faire un fichier de 40Mo contenant uniquement les nom et définition. Ce ficher peu alors être très utile dans diverses sources.

Un problème de lecture des caractères Unicode m'a obligé à mettre en place une sorte de nettoyeur.

-Le bouton wikilite permet de lancer les calcul (peu être assez long): le processus dure environ 2 minutes sur ma machine.
-Le bouton Lire permet d'afficher dans le mémo les lignes du XML comprise entre les deux bornes début et fin. (le XML contient environ 22 000 000 de lignes)
-La checkbox ligne permet d'afficher la ligne courante (ralentis grandement les calculs)

Conclusion :


Le ficher de sortie est un peu pollué, les définitions ne sont pas très lisibles mais suffisamment pour l'utiliser pour une source de recherche.

Codes Sources

A voir également

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.

Du même auteur (thithony)