HTMLfinder par BREL Sylvain et CLEMENT JP
-
  1. Introduction

    1. Le sujet

      Représentation de l'arborescence d'un site web sous forme graphique. Le site pourra être rapatrié à l'aide de robots automatiques, puis le contenu sera analysé afin de produire l'arborescence, y figurera le titre de chaque page et d'autres infos. Il sera permis de naviguer à l'intérieur de l'arborescence du site.

    2. L'outil

      Après analyse, nous avons choisi de ne pas utiliser de robots automatiques. D'une part car ils obligent l'écriture de fichiers temporaires, ce qui implique un besoin de place qui peut être important et ralentissement notable de l'application. Et d'autre part car ces utilitaires sont difficilement intégrables : que faire en cas d'adresse invalide, où s'arrêter.

      Pour ses qualités de portabilité et surtout d'ouverture sur les réseaux, le langage Java a été choisi. Notre projet, HTMLfinder, se charge donc de parser les pages HTML afin de reconstruire l'arborescence de la cible à l'aide des liens trouvés.

  2. Le programme

    1. Objectifs

      L'objectif principal a été de fournir une application viable. Pour cela, nous avons mis l'accent sur la rapidité et sur l'utilisabilité.

      La rapidité, car l'utilisateur ne veut jamais attendre, ni au niveau de l'exploration (moteur), ni au niveau de l'interface. L'utilisabilité, car la présentation doit être simple et claire et l'affichage toujours net (pas de scintillements etc.).

    2. Organisation

      Pour tenir nos objectifs, nous avons utilisé les possiblilités Objet de Java. Ainsi, nous avons obtenu un programme compact, souple et rapide. A titre informatif, notre code contient moins de 500 lignes, tout compris.

  3. L'interface

    L'interface est composée de plusieures zones :

    1. La zone Location

      Au label Location correspond une combo-box éditable. L'utilisateur peut soit entrer au clavier une URL, soit dérouler la combo-box et resélectionner une URL déjà parcourue (dans le cas où celle-ci aurait été modifiée).

      Il est à noter que, par commodité, l'utilisateur peut lancer plusieurs recherches à la fois (donc sans attendre la fin de celle(s) en cours).

    2. La zone arborescente

      La zone arborescente représente la structure des répertoires. Pour afficher le contenu d'un répertoire il faut cliquer dessus. Pour déplier un répertoire, on peut soit double-cliquer dessus, soit cliquer sur le petit bouton associé.

      Les dossiers sont affichés dynamiquement durant l'exploration, sans ralentissement ni scintillement.

    3. La zone contenu du répertoire

      Cette zone affiche le contenu du répertoire sélectionné sous forme de table. Dans les colonnes de la table se trouvent différentes informations sur les fichiers trouvés telles que la date ou la taille. L'utilisateur peut resizer les colonnes ou les déplacer à volonté ; elles resteront alors dans la disposition souhaitée.

      Durant l'exploration, les éléments trouvés sont aussi affichés dynamiquement, sans ralentissement ni scintillement. La sélection d'un répertoire trie l'affichage par dossier, puis par fichier.

    4. La zone information

      La zone située en bas de l'application renvoie à l'utilisateur diverses informations concernant l'état du moteur de recherche. Ces informations peuvent, entre autres, signaler le lancement ou l'arrêt d'une tâche, une erreur d'adresse de la part de l'utilisateur, etc.

  4. Utilisation

    1. Chargement

      Vous pouvez trouver notre projet à deux endroits :

      • dans le répertoire ~clement/www/Internet/projet_internet/decompresse/ (pour les ESSIiens)
      • ou bien ICI

    2. Installation

      Suivre les indications terrifiantes du fichier README !

  5. Conclusion

    Ce projet nous a permi de nous familiariser avec les URL et tout ce qui en découle. Java s'est révélé être un puissant outil de développement, bien adapté un monde du WEB.

    Au niveau de la programmation, il n'y a pas eu de difficulté. Les bugs de la bibliothèque Swing ont été soigneusement corrigés... Nous remercions plus particulièrement Vincent Gaypara pour son aide précieuse.



-
Dernière modification au 30/03/98