Cours/TD 2003-2004
Nouvelles Technologies et Enseignement (NTE)
Bureautique avancée
Méthodes quantitatives
Téléchargement de WAD
Cliquez sur le lien et enregistrer le fichier "wad.exe" sur le disque dur.
Double-cliquez maintenant sur "wad.exe" et choisissez l'endroit où vous voulez le décompresser. (Cliquez sur parcourir (browse en anglais) puis sur dézipper (unzip en anglais))
Vous obtenez alors un répertoire WAD à l'endroit où vous avez décompressé le fichier "wad.exe" avec les fichiers suivants:- ucbl.bmp (logo UCBL)
- wad.exe (le programme)
- opnx32.dll (la librairie pour l'importation de fichiers)
- wad.html (l'aide sous forme de document HTML)
Pour exécuter le programme, vous pouvez double-cliquer sur wad.exe en utilisant l'explorateur Windows par exemple. Vous pouvez également créer un racourci sur ce programme.
Pour utiliser l'aide vous devez disposer d'un browser tel que Netscape ou Microsoft Explorer.
Mises à part la gestion des fichiers et leur édition , les modules de calcul disponibles actuellement sont les suivants :
- Tests statistiques usuels,
- Méthodes factorielles (ACP et variantes),
- Analyse discriminante (méthode de Fisher),
- Classification non hiérarchique,
- Classification ascendante hiérarchique,
- Régression linéaire multiple.
- Agrégation des opinions,
Prise en main rapide
Pour effectuer une analyse, vous devez créer un fichier lisible par le logiciel. Ce fichier pourra être créé au moyen du logiciel et portera l'extention .DTX. Pour cela, vous devez utiliser, l'option FICHIERS/NOUVEAU. Vous définirez les dimensions de la grille de données et pourrez la remplir avec des valeurs numériques.
Attention : avant tout traitement vous devez sauvegarder vos données dans un fichier DTX.
Vous pouvez également importer vos données à partir d'un fichier texte, ou d'un fichier Excel. Dans ce cas aussi avant tout traitement vous devez sauvegarder vos données dans un fichier DTX.
Pour effectuer un traitement, utilisez l'option ANALYSE, et choisissez le type de traitement, ce qui provoquera l'affichage d'une fiche spécifique.
Toutes ses fiches sont construites sur le même modèle et comprennent principalement :
- un bouton options
- un bouton exécution
- un bouton résultat
- un bouton graphique (seulement pour certaines méthodes)
- un bouton quitter
et au moins 2 fenêtres d'édition pour indiquer :
- le nom du fichier de données
- le nom du fichier ou seront stockés les résultats.
Vous devez avant tout définir le nom du fichier de données ; pour cela, vous pourrez cliquer sur le bouton à côté de la fenêtre d'édition. Un nom de fichier résultat vous sera en général proposé automatiquement.
Ensuite vous pouvez cliquer sur le bouton options pour choisir le format de sortie des nombres, le nombre de décimales... Vous pouvez indiquer le nom d'un éditeur de texte (Wordpad ou Word par exemple) pour afficher les résultats ; sinon les résultats seront affichés par l'éditeur interne du programme. Le fichier "sauvegarde résultats" permet de stocker les principaux résultats afin qu'ils puissent être utilisés comme entrée par un autre programme.
Cliquez sur le bouton Exécuter pour effectuer les calculs.
Visualisez les résultats avec le bouton Résultats.
Affichez les graphiques avec le bouton Graphique. Certaines caractéristiques de la fenêtre graphiques peuvent être modifiées (utiliser DESSINER/OPTIONS).
1. Fichiers
menu Fichiervoir aussi Edition
La gestion des fichiers s'effectue au moyen du menu fichier
Nouveau : provoque la création d'une grille vide dont vous pourrez choisir la dimension. Après l'avoir remplie vous devrez l'enregistrer pour pouvoir effectuer un traitement quelconque.
Ouvrir : ouverture d'un fichier DTX
Enregistrer : pour enregistrer un fichier DTX.
Enregistrer sous : pour enregistrer une grille au format DTX en précisant un nom et un chemin.
Fermer : Ferme la grille active.
Importer : permet d'importer des fichiers texte, Excel, ou Dbase IV. Après importation le fichier apparaît dans la grille, vous devez l'enregistrer au format DTX avant d'effectuer un traitement.
Exporter sous fichier texte: Permet d'exporter une grille sous forme d'un fichier texte.
Quitter : Quitte l'application.
2. Edition
menu Edition
voir aussi Fichier
Les possibilités sont les suivantes :Supprimer ligne : supprime la ligne correspondant à la cellule active.
Supprimer colonne : supprime la colonne correspondant à la cellule active.
Ajouter ligne : ajoute une ligne vide à la fin.
Ajouter colonne : ajoute un colonne vide à la fin.
Contrôle des valeurs : vérifie si les éléments de la grille correspondent bien à des valeurs numériques. Si une valeur est incorrecte, l'exploration est arrêtée, et la case est entourée de rouge ; il faut effectuer la correction et relancer le contrôle.
Lors de l'enrégistrement d'un fichier un contrôle des valeurs est systématiquement effectué.Transposer : transpose la matrice des données contenue dans la grille active.
Centrer : centre la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle).
Centrer et réduire : centre et réduit la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle, et sa variance est égale à 1).
Centrer et normer : centre et norme la matrice des données par colonnes (à la suite de cette opération la moyenne de chaque colonne est nulle, et la somme des carrés de ses éléments est égale à 1).
Codage disjonctif complet : effectue le codage disjonctif complet de chaque colonne.
ATTENTION : cette opération ne doit être effectuée que si les variables sont de type qualitatif et ne comportent pas trop de modalités.Il est possible de déplacer une ligne (ou une colonne) en la faisant glisser à l'aide de la souris.
3. Tests statistiques usuels
Pas encore rédigé
4. Analyses
4.1. Méthodes factorielles ACP-AFC
Menu Analyses/Analyses factoriellesVoir aussi : Fenêtre Options ACP, Fenêtre Graphiques.
Cette option ouvre la fenêtre principale permettant le traitement d'une analyse factorielle .
Les possibilités sont les suivantes :
- ACP non centrée
- ACP
- ACP normée
- ACP doublement centrée
- AFC
- AFC multiple
- Analyse d'un tableau de distances
4.1.1. Fenêtre ACP-AFC
Pour effectuer une analyse de type ACP-AFC, les différentes actions à exécuter sont les suivantes.
Choix de la méthode.
Cochez la méthode que vous souhaitez mettre en oeuvre. En principe ce choix est effectué en ouvrant la fenêtre, mais il peut être modifié.
Choix des fichiers.
Il faut choisir obligatoirement le nom du fichier principal et le nom du fichier sorties.Nom du fichier principal.
Ce doit être un fichier DTX résultant de l'enregistrement d'une grille de données. Vous pouvez taper le nom du fichier de données dans la fenêtre d'édition, ou bien le sélectionner en cliquant sur le bouton à côté de cette fenêtre. Vous pouvez aussi double-cliquer su la fenêtre d'édition, ce qui provoquera l'apparition de la liste des fichiers récemment ouverts ; vous pourrez sélectionner le fichier que vous souhaitezNom du fichier résultats
En principe le même nom que le fichier principal est proposé avec l'extension .LST. Ce choix peut être modifié. Ce fichier sera créé lors de l'exécution. Attention, si un fichier du même nom existe il sera écrasé.De la même façon on pourra choisir un fichier lignes supplémentaires et un fichier colonnes supplémentaires. L'utilisation de ces fichiers n'est pas obligatoire : les fenêtres peuvent être laissées vides.
Attention : le fichier lignes supplémentaires doit comporter le même nombre de colonnes que le fichier principal, et le fichier colonnes supplémentaires doit comporter le même nombre de lignes que le fichier principal.
Options de calculs.
Le nombre de facteurs définit le nombre d'axes factoriels extraits. La valeur minimale est 2 pour pouvoir effectuer un graphique, la valeur maximale correspond au nombre de colonnes du fichier principal dans le cas d'un ACP (diminué de 1 dans le cas d'une AFC ou d'une ACP doublement centrée).Sorties détaillées. En cochant cette case, on obtient des résultats complémentaires comprenant en particulier diverses aides à l'interprétation.
Exécution des calculs.
Cliquez sur le bouton Exécuter Exe. La barre de statut indique "calculs en cours". Les calculs sont effectués dès que la barre de statut indique à nouveau "prêt".Lecture des résultats.
Cliquez sur le bouton Résultats Res. ; ce bouton permettant de visualiser le fichier résultats. Le menu aller au résultat permettra de vous déplacer fichier.Graphiques.
Cliquez sur le bouton graphiques Gr . Voir Graphiques ACP-AFCQuitter
Le bouton quitter Fin permet de fermer la fenêtre Analyse et de revenir au menu général.4.1.2. Options
Voir aussi : Analyses ACP-AFC,
Cette fenêtre est utilisée pour différent type d'analyses; elle offre différentes possibilités pour améliorer l'affichage des résultats. Elle est activée à partir de la fenêtre Analyses ACP-AFC en cliquant sur la bouton options Opt.
Sauvegardes résultats.
Les résultats principaux du traitement seront sauvegards dans ce fichier et pourrons ainsi être utilisés pour un autre type d'étude. Si le nom est laissé en blanc, aucune sauvegarde n'est effectuée.Formats
Nombres par lignes : Indique combien de valeurs au plus sont affichées sur une même ligne dans le fichier résultat.
Taille des réels : nombre de caractères utilisés dans le fichier sorties pour afficher les nombres réels.
Décimales : nombres de décimales pour l'affichage des réels.
Notation exponentielle : Si cette case est cochée tous les nombres réels sont affichées avec la notation exponentielle (appelée aussi notation scientifique : 3.145E+03 pour 314.5)
Editeur de texte :
C'est l'éditeur de texte qui sert à afficher les résultats. Il est possible de changer par exemple en indiquant WINWORD (ou tout autre traitement de texte), ce qui permet de créer facilement un rapport incluant les graphiques.
Attention : si les résultats ne s'affichent pas à l'écran lorsqu'on clique sur le bouton résultats, c'est en général parce que l'éditeur de texte n'a pas été trouvé sur le disque ; il faut alors indiquer le chemin complet dans le nom de l'éditeur, par exemple : C:\WORD\WINWORD.4.1.3. Graphiques ACP-AFC
voir aussi Analyse ACP-AFC, Options ACP
Cette fenêtre est utilisée pour réaliser les graphiques issus d'une analyse.
Menu fichiers.
Imprimer.
Imprime le graphique sur un carré d'environ 16cm.Copier.
Envoie le graphique dans le presse-papiers. Le graphique peut ensuite être collé par exemple dans un document Word ; le dessin obtenu alors est du type vectoriel et peut être subir des modifications (couleurs, titres ..).Il peut être agrandi ou retréci sans perte de qualité.Quitter
Ferme la fenêtre graphique.Menu Dessiner.
Dessiner
Redessine le graphique si certaines modifications dans les options n'ont pas été prises en compte.Choix Représentations.
Cette option provoque l'ouverture d'une boîte de dialogue qui permet de choisir les éléments à représenter : points lignes, vecteurs unitaires, points colonnes. Il est à noter qu'une représentation simultanée des points ligne et des points colonnes ne devrait être réalisée que dans le cas d'une AFC ou d'une ACP doublement centrée. Les vecteurs unitaires ne devraient être représentés que dans le cas d'une ACP, éventuellement simultanément avec les points lignes.Options.
ouvre une fenêtre permettant d'ajouter ou de modifier divers éléments du graphique (titre, taille des caractères ...).Barre de statuts.
Par défaut ce sont les facteurs 1 et 2 (X-Var, Y-var)qui sont représentés sur le graphique comme indiqué dans la barre de statuts. On peut choisir d'autres représentations dans la mesure ou plus de 2 facteurs ont été demandés lors de l'analyse. il suffit de cliquer sur l'un des 4 boutons de la barre. Pour connaître la position d'un point amener la flèche sur ce point avec la souris et cliquer avec le bouton gauche ; s'affichent alors en bas, les coordonnées du point (X=... , Y=...), et le nom de l'élément le plus proche (P=...).
4.2. Analyse discriminante
Menu Analyse/Analyse discriminanteLa réalisation d'une analyse discriminante est très semblable à celle d'une ACP, nous insistons surtout sur les différences. Les principales étapes sont les suivantes.
Choix du fichier de données(dit fichier de base)
La dernière colonne doit être la variable à expliquer, et doit donc représenter une variable qualitative ; les autres colonnes représentent les variables explicatives.L'échantillon test doit être de même nature que le fichier de données. Il doit comporter le même nombre de colonnes, la dernière étant toujours la variable à expliquer.
L'échantillon anonyme ne comporte que des variables explicatives. Il possède donc une colonne de moins que le fichier de données de base.
Il n'est pas nécessaire d'indiquer un fichier test et un fichier anonyme.
Mode sélection
La méthode d'analyse est une méthode qui sélectionne les variables explicatives par pas. On peut choisir entre :
- le critère de Wilks
- le nombre de bien classés (dans l'échantillon de base)
le critère de Wilks est plus rapide et est donc conseillé si le nombre d'individus ou de variables est important.Le traitement proprement dit comporte deux étapes :
- dans la première étape le programme va sélectionner une, puis 2, 3... variables, en indiquant la valeur du critère (nombre de bien classés, ou critère de Wilks),
- dans la deuxième étape, à partir de ces indications vous dervrez selectionner la ou les variables définitivement retenues. C'est uniquement avec ces variables que l'analyse définitive sera réalisée.Les fenêtres des options et graphiques sont analogues a celles correspondantes des analyses factorielles.
Il est à noter qu'un graphique ne peut être réalisé que si :
- la variable à expliquer comporte au moins 3 modalités.
- le fichier comporte au moins deux variables explicatives, et on a demandé au moins 2 axes factoriels.
4.3. Classification non hiérarchique
Menu Analyse/classification non hiérarchiquevoir aussi classification hiérarchique
La sélection des fichiers de données s'opère toujours de la même façon (voir par exemple les méthodes factorielles).
Deux algorithmes sont disponibles :
- La méthode des centres mobiles,
- la méthode non hiérarchique descendante (NHD)
Les conditions générales d'utilisation des deux méthodes sont analogues. La différence essentielle réside en ce que la méthode des centres mobiles fournit une partition unique dont le nombre d'éléments est défini par le paramètre nombre des classes m, tandis que la méthode NHD founit m partitions respctivement de 1, 2,..., m classes.
Les principales options sont :
- tableau de mesure,
- tableau de contingence.
Dans le cas d'un tableau de mesure, la distance euclidienne sera utilisée ; dans le cas d'un tableau de contigence c'est la distance du Khi2 qui sera utilisée.
On peut réduire les données, ce qui n'a évidemment de sens que dans le cas d'un tableau de mesure. Toujours dans le cas d'un tableau de mesures, il est possible d'affecter aux éléments à classifier des poids : ces poids devront être contenus dans la première colonne du fichier, et on cochera la case pondération des lignes.
La fenêtre des options est analogue à celle des méthodes factorielles.
Il n'y a pas possibilité de donner directement une représentation graphique des résultats. Il est naturellement possible d'effectuer une ACP ou une AFC en représentant chaque élément ligne par son groupe : dans ce but, il sera pratique d'utiliser le fichier sauvegarde indiqué dans la fenêtre options
4.4. Classification Ascendante Hiérarchique (CAH)
Menus Analyses/Classification hiérachique/Sans calcul du tableau des distanceset Analyses/Classification hiérachique/Avec calcul du tablaeu des distances
voir aussi Classification non hiérarchique
Deux algorithmes sont disponibles pour effectuer une CAH :
- sans calcul du tableau des distances,
- avec calcul du tableau des distances.
La version sans calcul du tableau des distance privilégie l'occupation mémoire, tandis que la version avec calcul du tableau des distances privilégie la vitesse de calcul.
En outre la version n'utilisant pas le tableau des distances ne permet pas l'utilisation de ceratains critères de groupement tels que le saut minimal, ou le diamètre minimal.
Les deux versions font l'objets de fenêtres différentes mais très semblables ; nous les présentons donc simultanément.
4.4.1. Les fenêtres Classifications hiérarchiques
La sélection du fichier de données et du fichier résultat s'effectue comme dans toutes les analyses (voir par exemple les méthodes facorielles). On dispose d'une option réduire les données.
Les différentes étapes d'une analyse sont les suivantes.
Sélection du type de données pour la version sans calcul du tableau des distances ; les possibilités sont :
- tableau de mesure qui correspond à l'utilisation du carré de la distance euclidienne
- tableau de contingence qui correspond à l'utilisation de la distance du Khi2
Sélection de la distance pour la version avec calcul du tableau des distances ; les possibilités sont :
- distance euclidienne ou euclidienne carré qui suppose que le tableau des données est un tableau de mesures.
- distance du khi2 qui suppose que le tableau des données est un tableau de contingence.
- distance de Jaccard qui suppose que le tableau des données est un tableau de valeur booléennes.
Sélection du critère de groupement ; les possibilités sont :
- saut minimal,(*)
- saut maximal,(*)
- distance moyenne,
- critère de Ward.
(*)seulement pour la version avec calcul du tableau des distances.
La version utilisant le tableau des distances permet de travailler à partir des données brutes ou bien directement à partir d'un tableau de distances (ou dissimilarités) déterminées par l'utilisateur. On cochera le bouton correspondant dans la partie type de données. On peut effectuer une coupe de la hiérarchie en précisant le nombre de classes dans la partition résultante. Pour cela on indiquera le nombre de classes souhaitées dans Description de partition en XX classes.
La fenêtre des options est analogue à celle des méthodes factorielles.
L'exécution s'effectue comme toujours en cliquant sur le bouton EXE. On peut alors lire les résultats (bouton RES) et dessiner la hiérarchie (bouton GR) qui provoquera l'ouvertue de la fenêtre graphique des hiérarchies.
4.4.2. La fenêtre graphique pour les hiérarchies
Cette fenêtre est très semblable à celle des méthodes factorielles. Nous n'en commenterons que les particularités. Informations de la barre des statuts : en cliquant avec le bouton gauche sur un sommet de la hiérarchie, la barre de statut affiche le nom du sommet, son niveau et son numéro.
En cliquant avec le bouton droit sur un sommet de la hiérarchie on fait apparaître une fenêtre contenant des informations détaillées sur le sommet ; en particulier on obtiendra la listes des éléments contenus dans le sommet.
4.5. Régression linéaire multiple
Menu Analyse/Régression linéaireLa mise en oeuvre d'une régression s'effectue simplement suivant le schéma habituel: Sélection du fichier de données et du fichier résultat (voir Méthodes factorielles), puis sélection du numéro de colonne de la variable à expliquer. Après le choix d'options éventuelles, on exécute en cliquant sur de bouton Exe, et on visualise les résultats en cliquant sur Res.
Aucune possibilité de graphique n'est prévue pour l'instant.
4.6. Agrégation des Opinions
Pas encore rédigé