News Search

Un moteur de recherche sur les news.
© GARCIA - LEBROZEC 1999

Introduction

NewsSearch est un moteur de recherche sur les News du serveur de l'ESSI : news-srv.essi.fr.
Il permet de trouver des messages postés dans des NewsGroups en fonction de certains critères de recherche. Il est donc possible de preciser, lors de la recherche :
- un nom de NewsGroup,
- un mot-clé,
- ou même une expression régulière à rechercher.
Ce moteur étant destiné à l'ESSI, il possède l'avantage de fonctionner en local (n'utilise pas NNTP) ce qui accélère son temps de recherche.

Installation

Pour son installation, News Search nécessite une machine possédant :

Fichiers nécessaires :

Pour l'interface
         - index.html                 -- génération des frames
         - requete.html               -- formulaire de requêtes - frame d'entête
         - doc.html                   -- documentation - frame centrale
         - banner.html                -- frame de pied de page
         - images                     -- répertoire contenant les images de l'interface

         - images/titre.gif           -- image NewsSearch
         - images/submit.gif          -- image Search
      
Pour le traitement
         - requete.php3               -- gestion du formulaire
         - base                       -- répertoire contenant les fichiers index de Glimpse

         - base/.glimpse_filenames        
         - base/.glimpse_filenames_index  
         - base/.glimpse_filetimes        
         - base/.glimpse_index      
         - base/.glimpse_message     
         - base/.glimpse_partitions  
         - base/.glimpse_statistics  

      

Modifications éventuelles des fichiers :

Génération d'index avec Glimpse :

Pour générer un index Glimpse pour News Search, la commande est la suivante :
Si vous êtes dans le répertoire racine de News Search
glimpseindex -b -t -H ./base -f "chemin d'accés aux News"

exemple :
glimpseindex -b -t -H ./base -f /news/articles

Attention, pour générer un index, vous devez imperativement être sur une machine possédant un accés direct au répertoire contenant les news (avoir le répertoire news dans son arborescense).

Attention, la première génération d'index peut être trés longue (plusieurs heures). Cependant les générations suivantes seront bien plus courtes car alors, Glimpse traitera uniquement les nouveaux fichiers.


Description

Champs obligatoire :
Champs facultatifs :

Les PATTERNS possibles

Glimpse permet, pour la recherche, de fournir divers types de pattern :
Expression booléenne Glimpse :
Le champs PATTERN et le champs NewsGroup permettent à l'utilisateur de saisir des expressions booléennes. On peut ainsi choisir des PATTERN complexe.
Exemple : (linux;unix),windows.
Cela retournera tous les messages contenant "linux ET unix" plus les messages contenant "windows".

Attention, Il ne doit pas y avoir d'espace entre les mots et l'opérateur logique.


Expression régulière :
Le champs PATTERN et le champs NewsGroup permettent à l'utilisateur de saisir des expressions régulières.
Voici un aperçu des expressions régulières possibles dans Glimpse : On peut également composer les symboles.
Exemple : l.*x retournera tous les messages contenant un "l", suivi de zéro ou plusieurs lettres avant de retrouver un "x" (retournera : "lx", "lux", "linux", ...etc).

Attention, Les expressions régulières ne s'appliquent qu'à 1 mot.
Ainsi un.*x retrournera "unix" mais pas "un prix"