Cours/TD 2002-2003
  • Téléchargement de WAD


Ce programme fonctionne sous Windows95/98/NT

Cliquez sur le lien et enregistrer le fichier "wad.exe" sur le disque dur.

Double-cliquez maintenant sur "wad.exe" et choisissez l'endroit où vous voulez le décompresser. (Cliquez sur parcourir (browse en anglais) puis sur dézipper (unzip en anglais))

Vous obtenez alors un répertoire WAD à l'endroit où vous avez décompressé le fichier "wad.exe" avec les fichiers suivants:

  • ucbl.bmp (logo UCBL)
  • wad.exe (le programme)
  • opnx32.dll (la librairie pour l'importation de fichiers)
  • wad.html (l'aide sous forme de document HTML)

Pour exécuter le programme, vous pouvez double-cliquer sur wad.exe en utilisant l'explorateur Windows par exemple. Vous pouvez également créer un racourci sur ce programme.

Pour utiliser l'aide vous devez disposer d'un browser tel que Netscape ou Microsoft Explorer.

Mises à part la gestion des fichiers et leur édition , les modules de calcul disponibles actuellement sont les suivants :


Prise en main rapide

Pour effectuer une analyse, vous devez créer un fichier lisible par le logiciel. Ce fichier pourra Ítre créé au moyen du logiciel et portera l'extention .DTX. Pour cela, vous devez utiliser, l'option FICHIERS/NOUVEAU. Vous définirez les dimensions de la grille de données et pourrez la remplir avec des valeurs numériques.

Attention : avant tout traitement vous devez sauvegarder vos données dans un fichier DTX.

Vous pouvez également importer vos données à partir d'un fichier texte, ou d'un fichier Excel. Dans ce cas aussi avant tout traitement vous devez sauvegarder vos données dans un fichier DTX.

Pour effectuer un traitement, utilisez l'option ANALYSE, et choisissez le type de traitement, ce qui provoquera l'affichage d'une fiche spécifique.

Toutes ses fiches sont construites sur le mÍme modèle et comprennent principalement :

  • un bouton options
  • un bouton exécution
  • un bouton résultat
  • un bouton graphique (seulement pour certaines méthodes)
  • un bouton quitter

et au moins 2 fenÍtres d'édition pour indiquer :

  • le nom du fichier de données
  • le nom du fichier ou seront stockés les résultats.

Vous devez avant tout définir le nom du fichier de données ; pour cela, vous pourrez cliquer sur le bouton à cŰté de la fenÍtre d'édition. Un nom de fichier résultat vous sera en général proposé automatiquement.

Ensuite vous pouvez cliquer sur le bouton options pour choisir le format de sortie des nombres, le nombre de décimales... Vous pouvez indiquer le nom d'un éditeur de texte (Wordpad ou Word par exemple) pour afficher les résultats ; sinon les résultats seront affichés par l'éditeur interne du programme. Le fichier "sauvegarde résultats" permet de stocker les principaux résultats afin qu'ils puissent Ítre utilisés comme entrée par un autre programme.

Cliquez sur le bouton Exécuter pour effectuer les calculs.

Visualisez les résultats avec le bouton Résultats.

Affichez les graphiques avec le bouton Graphique. Certaines caractéristiques de la fenÍtre graphiques peuvent Ítre modifiées (utiliser DESSINER/OPTIONS).


1. Fichiers


menu
Fichier

voir aussi Edition

La gestion des fichiers s'effectue au moyen du menu fichier

Nouveau : provoque la création d'une grille vide dont vous pourrez choisir la dimension. Après l'avoir remplie vous devrez l'enregistrer pour pouvoir effectuer un traitement quelconque.

Ouvrir : ouverture d'un fichier DTX

Enregistrer : pour enregistrer un fichier DTX.

Enregistrer sous : pour enregistrer une grille au format DTX en précisant un nom et un chemin.

Fermer : Ferme la grille active.

Importer : permet d'importer des fichiers texte, Excel, ou Dbase IV. Après importation le fichier apparaÓt dans la grille, vous devez l'enregistrer au format DTX avant d'effectuer un traitement.

Exporter sous fichier texte: Permet d'exporter une grille sous forme d'un fichier texte.

Quitter : Quitte l'application.


2. Edition

menu Edition

voir aussi Fichier


Les possibilités sont les suivantes :

Supprimer ligne : supprime la ligne correspondant à la cellule active.

Supprimer colonne : supprime la colonne correspondant à la cellule active.

Ajouter ligne : ajoute une ligne vide à la fin.

Ajouter colonne : ajoute un colonne vide à la fin.

ContrŰle des valeurs : vérifie si les éléments de la grille correspondent bien à des valeurs numériques. Si une valeur est incorrecte, l'exploration est arrÍtée, et la case est entourée de rouge ; il faut effectuer la correction et relancer le contrŰle.
Lors de l'enrégistrement d'un fichier un contrŰle des valeurs est systématiquement effectué.

Transposer : transpose la matrice des données contenue dans la grille active.

Centrer : centre la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle).

Centrer et réduire : centre et réduit la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle, et sa variance est égale à 1).

Centrer et normer : centre et norme la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle, et la somme des carrés de ses éléments est égale à 1).

Codage disjonctif complet : effectue le codage disjonctif complet de chaque colonne.
ATTENTION : cette opération ne doit Ítre effectuée que si les variables sont de type qualitatif et ne comportent pas trop de modalités.

Il est possible de déplacer une ligne (ou une colonne) en la faisant glisser à l'aide de la souris.


3. Tests statistiques usuels

Pas encore rédigé


4. Analyses



4.1. Méthodes factorielles ACP-AFC


Menu
Analyses/Analyses factorielles

Voir aussi : FenÍtre Options ACP, FenÍtre Graphiques.

Cette option ouvre la fenÍtre principale permettant le traitement d'une analyse factorielle .

Les possibilités sont les suivantes :

  • ACP non centrée
  • ACP
  • ACP normée
  • ACP doublement centrée
  • AFC
  • AFC multiple
  • Analyse d'un tableau de distances

4.1.1. FenÍtre ACP-AFC

Pour effectuer une analyse de type ACP-AFC, les différentes actions à exécuter sont les suivantes.

Choix de la méthode.

Cochez la méthode que vous souhaitez mettre en oeuvre. En principe ce choix est effectué en ouvrant la fenÍtre, mais il peut Ítre modifié.

Choix des fichiers.
Il faut choisir obligatoirement le nom du fichier principal et le nom du fichier sorties.

Nom du fichier principal.
Ce doit Ítre un fichier DTX résultant de l'enregistrement d'une grille de données. Vous pouvez taper le nom du fichier de données dans la fenÍtre d'édition, ou bien le sélectionner en cliquant sur le bouton à cŰté de cette fenÍtre. Vous pouvez aussi double-cliquer su la fenÍtre d'édition, ce qui provoquera l'apparition de la liste des fichiers récemment ouverts ; vous pourrez sélectionner le fichier que vous souhaitez

Nom du fichier résultats
En principe le mÍme nom que le fichier principal est proposé avec l'extension .LST. Ce choix peut Ítre modifié. Ce fichier sera créé lors de l'exécution. Attention, si un fichier du mÍme nom existe il sera écrasé.

De la mÍme faÁon on pourra choisir un fichier lignes supplémentaires et un fichier colonnes supplémentaires. L'utilisation de ces fichiers n'est pas obligatoire : les fenÍtres peuvent Ítre laissées vides.

Attention : le fichier lignes supplémentaires doit comporter le mÍme nombre de colonnes que le fichier principal, et le fichier colonnes supplémentaires doit comporter le mÍme nombre de lignes que le fichier principal.

Options de calculs.
Le nombre de facteurs définit le nombre d'axes factoriels extraits. La valeur minimale est 2 pour pouvoir effectuer un graphique, la valeur maximale correspond au nombre de colonnes du fichier principal dans le cas d'un ACP (diminué de 1 dans le cas d'une AFC ou d'une ACP doublement centrée).

Sorties détaillées. En cochant cette case, on obtient des résultats complémentaires comprenant en particulier diverses aides à l'interprétation.

Exécution des calculs.
Cliquez sur le bouton Exécuter Exe. La barre de statut indique "calculs en cours". Les calculs sont effectués dès que la barre de statut indique à nouveau "prÍt".

Lecture des résultats.
Cliquez sur le bouton Résultats Res. ; ce bouton permettant de visualiser le fichier résultats. Le menu aller au résultat permettra de vous déplacer fichier.

Graphiques.
Cliquez sur le bouton graphiques Gr . Voir Graphiques ACP-AFC

Quitter
Le bouton quitter Fin permet de fermer la fenÍtre Analyse et de revenir au menu général.

4.1.2. Options

Voir aussi : Analyses ACP-AFC,

Cette fenÍtre est utilisée pour différent type d'analyses; elle offre différentes possibilités pour améliorer l'affichage des résultats. Elle est activée à partir de la fenÍtre Analyses ACP-AFC en cliquant sur la bouton options Opt.

Sauvegardes résultats.
Les résultats principaux du traitement seront sauvegards dans ce fichier et pourrons ainsi Ítre utilisés pour un autre type d'étude. Si le nom est laissé en blanc, aucune sauvegarde n'est effectuée.

Formats

Nombres par lignes : Indique combien de valeurs au plus sont affichées sur une mÍme ligne dans le fichier résultat.

Taille des réels : nombre de caractères utilisés dans le fichier sorties pour afficher les nombres réels.

Décimales : nombres de décimales pour l'affichage des réels.

Notation exponentielle : Si cette case est cochée tous les nombres réels sont affichées avec la notation exponentielle (appelée aussi notation scientifique : 3.145E+03 pour 314.5)

Editeur de texte :
C'est l'éditeur de texte qui sert à afficher les résultats. Il est possible de changer par exemple en indiquant WINWORD (ou tout autre traitement de texte), ce qui permet de créer facilement un rapport incluant les graphiques.
Attention : si les résultats ne s'affichent pas à l'écran lorsqu'on clique sur le bouton résultats, c'est en général parce que l'éditeur de texte n'a pas été trouvé sur le disque ; il faut alors indiquer le chemin complet dans le nom de l'éditeur, par exemple : C:\WORD\WINWORD.

4.1.3. Graphiques ACP-AFC

voir aussi Analyse ACP-AFC, Options ACP

Cette fenÍtre est utilisée pour réaliser les graphiques issus d'une analyse.

Menu fichiers.

Imprimer.
Imprime le graphique sur un carré d'environ 16cm.

Copier.
Envoie le graphique dans le presse-papiers. Le graphique peut ensuite Ítre collé par exemple dans un document Word ; le dessin obtenu alors est du type vectoriel et peut Ítre subir des modifications (couleurs, titres ..).Il peut Ítre agrandi ou retréci sans perte de qualité.

Quitter
Ferme la fenÍtre graphique.

Menu Dessiner.

Dessiner
Redessine le graphique si certaines modifications dans les options n'ont pas été prises en compte.

Choix Représentations.
Cette option provoque l'ouverture d'une boÓte de dialogue qui permet de choisir les éléments à représenter : points lignes, vecteurs unitaires, points colonnes. Il est à noter qu'une représentation simultanée des points ligne et des points colonnes ne devrait Ítre réalisée que dans le cas d'une AFC ou d'une ACP doublement centrée. Les vecteurs unitaires ne devraient Ítre représentés que dans le cas d'une ACP, éventuellement simultanément avec les points lignes.

Options.
ouvre une fenÍtre permettant d'ajouter ou de modifier divers éléments du graphique (titre, taille des caractères ...).

Barre de statuts.
Par défaut ce sont les facteurs 1 et 2 (X-Var, Y-var)qui sont représentés sur le graphique comme indiqué dans la barre de statuts. On peut choisir d'autres représentations dans la mesure ou plus de 2 facteurs ont été demandés lors de l'analyse. il suffit de cliquer sur l'un des 4 boutons de la barre. Pour connaÓtre la position d'un point amener la flèche sur ce point avec la souris et cliquer avec le bouton gauche ; s'affichent alors en bas, les coordonnées du point (X=... , Y=...), et le nom de l'élément le plus proche (P=...).




4.2. Analyse discriminante


Menu
Analyse/Analyse discriminante

La réalisation d'une analyse discriminante est très semblable à celle d'une ACP, nous insistons surtout sur les différences. Les principales étapes sont les suivantes.

Choix du fichier de données(dit fichier de base)
La dernière colonne doit Ítre la variable à expliquer, et doit donc représenter une variable qualitative ; les autres colonnes représentent les variables explicatives.

L'échantillon test doit Ítre de mÍme nature que le fichier de données. Il doit comporter le mÍme nombre de colonnes, la dernière étant toujours la variable à expliquer.

L'échantillon anonyme ne comporte que des variables explicatives. Il possède donc une colonne de moins que le fichier de données de base.

Il n'est pas nécessaire d'indiquer un fichier test et un fichier anonyme.

Mode sélection
La méthode d'analyse est une méthode qui sélectionne les variables explicatives par pas. On peut choisir entre :
- le critère de Wilks
- le nombre de bien classés (dans l'échantillon de base)
le critère de Wilks est plus rapide et est donc conseillé si le nombre d'individus ou de variables est important.

Le traitement proprement dit comporte deux étapes :
- dans la première étape le programme va sélectionner une, puis 2, 3... variables, en indiquant la valeur du critère (nombre de bien classés, ou critère de Wilks),
- dans la deuxième étape, à partir de ces indications vous dervrez selectionner la ou les variables définitivement retenues. C'est uniquement avec ces variables que l'analyse définitive sera réalisée.

Les fenÍtres des options et graphiques sont analogues a celles correspondantes des analyses factorielles.

Il est à noter qu'un graphique ne peut Ítre réalisé que si :

  • la variable à expliquer comporte au moins 3 modalités.
  • le fichier comporte au moins deux variables explicatives, et on a demandé au moins 2 axes factoriels.

4.3. Classification non hiérarchique


Menu
Analyse/classification non hiérarchique

voir aussi classification hiérarchique

La sélection des fichiers de données s'opère toujours de la mÍme faÁon (voir par exemple les méthodes factorielles).

Deux algorithmes sont disponibles :

  • La méthode des centres mobiles,
  • la méthode non hiérarchique descendante (NHD)

Les conditions générales d'utilisation des deux méthodes sont analogues. La différence essentielle réside en ce que la méthode des centres mobiles fournit une partition unique dont le nombre d'éléments est défini par le paramètre nombre des classes m, tandis que la méthode NHD founit m partitions respctivement de 1, 2,..., m classes.

Les principales options sont :

  • tableau de mesure,
  • tableau de contingence.

Dans le cas d'un tableau de mesure, la distance euclidienne sera utilisée ; dans le cas d'un tableau de contigence c'est la distance du Khi2 qui sera utilisée.

On peut réduire les données, ce qui n'a évidemment de sens que dans le cas d'un tableau de mesure. Toujours dans le cas d'un tableau de mesures, il est possible d'affecter aux éléments à classifier des poids : ces poids devront Ítre contenus dans la première colonne du fichier, et on cochera la case pondération des lignes.

La fenÍtre des options est analogue à celle des méthodes factorielles.

Il n'y a pas possibilité de donner directement une représentation graphique des résultats. Il est naturellement possible d'effectuer une ACP ou une AFC en représentant chaque élément ligne par son groupe : dans ce but, il sera pratique d'utiliser le fichier sauvegarde indiqué dans la fenÍtre options




4.4. Classification Ascendante Hiérarchique (CAH)


Menus
Analyses/Classification hiérachique/Sans calcul du tableau des distances

et Analyses/Classification hiérachique/Avec calcul du tablaeu des distances

voir aussi Classification non hiérarchique

Deux algorithmes sont disponibles pour effectuer une CAH :

  • sans calcul du tableau des distances,
  • avec calcul du tableau des distances.

La version sans calcul du tableau des distance privilégie l'occupation mémoire, tandis que la version avec calcul du tableau des distances privilégie la vitesse de calcul.

En outre la version n'utilisant pas le tableau des distances ne permet pas l'utilisation de ceratains critères de groupement tels que le saut minimal, ou le diamètre minimal.

Les deux versions font l'objets de fenÍtres différentes mais très semblables ; nous les présentons donc simultanément.

4.4.1. Les fenÍtres Classifications hiérarchiques

La sélection du fichier de données et du fichier résultat s'effectue comme dans toutes les analyses (voir par exemple les méthodes facorielles). On dispose d'une option réduire les données.

Les différentes étapes d'une analyse sont les suivantes.

Sélection du type de données pour la version sans calcul du tableau des distances ; les possibilités sont :

  • tableau de mesure qui correspond à l'utilisation du carré de la distance euclidienne
  • tableau de contingence qui correspond à l'utilisation de la distance du Khi2

Sélection de la distance pour la version avec calcul du tableau des distances ; les possibilités sont :

  • distance euclidienne ou euclidienne carré qui suppose que le tableau des données est un tableau de mesures.
  • distance du khi2 qui suppose que le tableau des données est un tableau de contingence.
  • distance de Jaccard qui suppose que le tableau des données est un tableau de valeur booléennes.

Sélection du critère de groupement ; les possibilités sont :

  • saut minimal,(*)
  • saut maximal,(*)
  • distance moyenne,
  • critère de Ward.

(*)seulement pour la version avec calcul du tableau des distances.

La version utilisant le tableau des distances permet de travailler à partir des données brutes ou bien directement à partir d'un tableau de distances (ou dissimilarités) déterminées par l'utilisateur. On cochera le bouton correspondant dans la partie type de données. On peut effectuer une coupe de la hiérarchie en précisant le nombre de classes dans la partition résultante. Pour cela on indiquera le nombre de classes souhaitées dans Description de partition en XX classes.

La fenÍtre des options est analogue à celle des méthodes factorielles.

L'exécution s'effectue comme toujours en cliquant sur le bouton EXE. On peut alors lire les résultats (bouton RES) et dessiner la hiérarchie (bouton GR) qui provoquera l'ouvertue de la fenÍtre graphique des hiérarchies.

4.4.2. La fenÍtre graphique pour les hiérarchies Cette fenÍtre est très semblable à celle des méthodes factorielles. Nous n'en commenterons que les particularités. Informations de la barre des statuts : en cliquant avec le bouton gauche sur un sommet de la hiérarchie, la barre de statut affiche le nom du sommet, son niveau et son numéro.

En cliquant avec le bouton droit sur un sommet de la hiérarchie on fait apparaÓtre une fenÍtre contenant des informations détaillées sur le sommet ; en particulier on obtiendra la listes des éléments contenus dans le sommet.


4.5. Régression linéaire multiple


Menu Analyse/Régression linéaire

La mise en oeuvre d'une régression s'effectue simplement suivant le schéma habituel: Sélection du fichier de données et du fichier résultat (voir Méthodes factorielles), puis sélection du numéro de colonne de la variable à expliquer. Après le choix d'options éventuelles, on exécute en cliquant sur de bouton Exe, et on visualise les résultats en cliquant sur Res.

Aucune possibilité de graphique n'est prévue pour l'instant.


4.6. Agrégation des Opinions


Pas encore rédigé