chantal Invité
 | Sujet: L3 statistiques Mar 21 Juil - 12:28 | |
| désolée, mais le copié collé ne fonctionne pas, alors voici le texte: <table border=0 cellSpacing=0 cellPadding=0 width="100%"><tr vAlign=top><td height=31>Qu'est-ce que l'analyse multivariée</TD></TR> <tr vAlign=top><td height=31>L'analyse multivariée recouvre un ensemble de méthodes destinées à synthétiser l'information issue de plusieurs variables, pour mieux l'expliquer. </TD></TR></TABLE> |
Il existe deux grandes catégories de méthodes : les méthodes descriptives et les méthodes explicatives. Les méthodes descriptives Ces méthodes visent à structurer et simplifier les données issues de plusieurs variables, sans privilégier l'une d'entre elles en particulier. Les méthodes les plus utilisées dans le traitement des enquêtes sont : - l'analyse en composantes principales (ACP), - l'analyse factorielle des correspondances (AFC), - l'analyse des correspondances multiples (ACM), - la typologie et les méthodes de classification. Le choix de l'une ou de l'autre de ces méthodes dépend des objectifs poursuivis et du type de données à analyser.
L'analyse en composantes principales L'ACP s'applique à un ensemble de variables numériques. Elle permet de positionner les individus sur un plan en deux dimensions, en fonction de la proximité de leurs réponses aux questions sélectionnées. Les variables sont également représentées sur le mapping, mais de manière indépendante des points-individus. L'ACP permet ainsi de mettre en évidence la structuration des réponses en montrant le regroupement des individus selon des combinaisons de réponses aux questions prises en compte. Les axes du mapping ne correspondent généralement pas à l'une ou l'autre des variables mais à un regroupement optimal de plusieurs variables (ex : revenu et niveau d'études peuvent participer ensemble à la formation d'un axe dans la mesure où elles peuvent être fortement corrélées). L'ACP est très pratique lorsque l'on travaille sur un ensemble limité et identifié d'individus statistiques. Ainsi, si l'on souhaite analyser des points de vente en fonction de différents critères numériques (surface, personnel, CA, nombre de pièces vendues…), l'ACP permet d'obtenir une cartographie intéressante, qui regroupe les points de vente selon tous les critères retenus et qui permet ainsi de les catégoriser et d'identifier notamment, d'un coup d'œil, les cas hors norme (ex : surface et personnel importants mais CA faible…). Le tableau de départ de l'ACP comporte les individus en ligne et les variables en colonne, avec, dans chaque case, la réponse numérique de l'individu à la question correspondante. Les questions qualitatives ordinales, c'est-à-dire, celles dont les réponses peuvent être ordonnées entre elles (échelles, fréquences...) peuvent être recodifiées pour entrer dans le tableau de l'ACP. Cette recodification doit être généralement préparée à l'avance. Toutefois, certains logiciels d'analyse statistique comme STAT'Mania, permettent de réaliser cette recodification en direct, lors du choix des variables à faire entrer dans l'ACP. L'algorithme de l'ACP effectue sur la matrice individus/variables différentes opérations (centrage-réduction des données, diagonalisation de la matrice, extraction de valeurs propres et de vecteurs propres…), en vue de passer du nombre de variables initial à un petit nombre de variables obtenues par combinaison des premières. Ces nouvelles composantes forment les axes du mapping. La première composante est celle qui résume le mieux les informations contenues dans le tableau. La deuxième apporte un pourcentage inférieur mais complémentaire d'information, et ainsi de suite. Le mapping d'ACP représente d'abord la première composante (axe horizontal) et la seconde (axe vertical). La somme des pourcentages d'explication des deux composantes renseigne sur le taux de déperdition d'information à partir des données de base. Ainsi, si la première composante résume 62% du tableau et la seconde 21%, l'information représentée sur le mapping est de 83%. L'information « perdue » est donc de 17%. Les points-individus sont représentés sur le mapping en fonction de leur coordonnées sur les facteurs. Les points proches correspondent à des individus ayant des profils proches, a priori, quant aux réponses aux variables prises en compte dans l'analyse. Les points-variables sont également représentés sur le mapping, mais de manière complètement indépendante des individus. Leur représentation indique leur corrélation avec les facteurs, à l'intérieur d'un cercle de rayon 1 défini avec une échelle arbitraire (qui peut être changée à loisir sans affecter la représentation des points-individus). Ces points variables renseignent sur le sens à donner aux axes. Ainsi, une variable proche du cercle de corrélation (corrélation forte) et proche d'un axe participe beaucoup à la formation de cet axe. Les angles inter-variables (en partant de l'origine) renseignent sur les corrélations entre elles. Ainsi, deux variables formant un petit angle sont fortement corrélées, alors qu'un angle droit signifierait qu'elles sont indépendantes. L'analyse des correspondances L'analyse factorielle des correspondances s'applique à deux variables qualitatives (nominales). Elle permet de positionner sur un mapping les modalités de réponses des deux questions. L'analyse des correspondances Multiples (ACM) généralise l'AFC à un nombre quelconque de variables et permet donc de représenter sur le même mapping les modalités de réponses de plus de deux variables. Comme pour l'ACP, le but de ces analyses est de dégager des dimensions cachées contenues dans les réponses aux variables sélectionnées, pour faciliter l'interprétation de tableaux pas toujours lisibles au départ.
|
|
|