banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

Annonce

Rencontres QGIS 2025

L'appel à participation est ouvert jusqu'au 19 janvier 2025!

#1 Sat 23 February 2008 20:28

Ben Man
Juste Inscrit !
Date d'inscription: 23 Feb 2008
Messages: 3

ACP: critères d'utilisation !

Bonjour,
Je suis un Novice en stat et j'utilise R depuis une semaine avec le packages ade4 pour réaliser des ACP. Ca marche très bien, toutefois j'ai besoin de vos conseils. J'ai un tableau de 92 lignes et 91 colonnes.
Est ce que ce n'est pas beaucoup de variables, vu le nombre des lignes?
Est ce qu'il y a un critère qui permet de connaître le nombre d'axe à retenir?
Merci d'avance ;-) KBM ;-)

Hors ligne

 

#2 Sat 23 February 2008 23:37

lcadamuro
Participant actif
Lieu: Briatexte
Date d'inscription: 23 Nov 2005
Messages: 142

Re: ACP: critères d'utilisation !

Bonsoir,
Une telle question devrait être posée sur un forum "statistiques" plutôt que "géomatique".

Enfin, on peut toujours donner des éléments de réponses:
- le nombre de variables ne me choque pas outre mesure, c'est plutôt leur type qui m'inquièterait au premier abord... Vous avez 91 descripteurs de dimensions homogènes ??? Si la réponse est non, votre ACP ne veut rien dire...

- Concernant le nombre d'axes à retenir, il me semble que ADE4 donnait la contribution de chaque axe et classait par défaut les axes par ordre décroissant.... donc, les axes 1 et 2 expliquent un maximum d'association. Toutefois, dans le cadre de votre étude, vous pouvez vouloir étudier le cas d'un évènement exceptionnel qui sera associé à un axe n (10-15-30....) donc s'arrêter à 2-3 axes n'aurait aucun intérêt pour vous.

Enfin, et pour clore ce chapitre (qui m'aura ramené à mes chères études du siècle dernier) sachez que si vous faites des statistiques exploratoires (en clair, vous soupçonnez une corrélation plus ou moins diffuse entre une série d'observations et une/plusieurs variables), préférez une AFC sur des échantillons à variables regroupées en classes de même taille couplée à une classification hiérarchique automatique. C'est certes plus long à coder dans le tableau mais les corrélations sont beaucoup plus claires et la méthode plus rigoureuse que l'ACP qui a longtemps été utilisée à tort et à travers sans connaitre ses limites (les mentalités ont du mal à évoluer parfois).

Cordialement,
Laurent.

Hors ligne

 

#3 Sun 24 February 2008 15:38

alban
Participant assidu
Lieu: Chizé
Date d'inscription: 16 May 2007
Messages: 156
Site web

Re: ACP: critères d'utilisation !

Bonjour,

Concernant le nombre des variables, ça ne me pose pas non plus de problème :
les analyses multifactorielles peuvent être (sont faites ?) pour explorer le jeu de données. Donc, tu mets ton jeu de données et l´analyse multifactorielle te dira quelles variables sont importantes (i.e. fortement
corrélées aux premiers axes)

N´étant pas personnellement un statisticien, je te renvoie sur un cours qui a l´air bien adapté :
"Analyse multivariée de données géographiques" de Pierre Dumolard
http://www.infotheque.info/cache/8725/i … multiv.pdf

Désolé, mais je ne l´ai que survolé pour l´instant (pas eu besoin récemment de faire des analyses multifactorielles). Toutefois ce survol me permet déjà de confirmer que la nature des données va t´imposer ACP ou AFC (j´avais également oublié un cours du siècle passé wink ).

Bonne lecture et bon courage,

Alban
____________________________
       Alban Thomas
http://alban-thomas.exen.fr/

Hors ligne

 

#4 Sun 24 February 2008 22:29

lcadamuro
Participant actif
Lieu: Briatexte
Date d'inscription: 23 Nov 2005
Messages: 142

Re: ACP: critères d'utilisation !

(re) bonjour,
J'ai retrouvé ça dans ma thèse....
Concernant l'ACP:
"L’Analyse en Composantes Principales (A.C.P.) est utilisée pour décrire des tableaux
quantitatifs, y rechercher et en expliquer la structure. Les unités statistiques étant centrées à
l’origine et transformées en pourcentage (variable centrée réduite), la notion d’unité de
mesure n’intervient plus et l’on peut comparer des variables de poids statistiques différents.
"
Concernant L'AFC:
"L’Analyse Factorielle des Correspondances (A.F.C.) a été utilisée dans la recherche de
corrélations entre les unités statistiques considérées et leurs descripteurs. Elle se pratique sur
une table de contingence associant en lignes les unités statistiques et en colonnes les
descripteurs (Ex. Stations associées à leur composition floristique). Ce type d’analyse
présente l’avantage d’étudier simultanément les proximités entre les profils des unités
statistiques entre elles et les profils des descripteurs entre eux. Les résultats de cette analyse
sont alors représentés sous la forme d’un nuage de points dans un espace factoriel.
Concrètement, ce type d’analyse permet d’étudier la répartition des espèces au sein des
différents relevés et illustre graphiquement la proximité entre des lots d’espèces. De la même
façon, elle décrit la proximité des différentes stations sur la base de leur composition
floristique.
"
Et concernant les classifications hiérarchiques:
"L’analyse des nuages de points obtenus par les différentes Analyses Factorielles réalisées a
été effectuée par l’utilisation des méthodes de Classification Hiérarchiques Automatiques
plutôt que par interprétation visuelle jugée peu objective. Le regroupement des différents
points a été effectué sur la base de leurs coordonnées dans l’espace factoriel obtenu. Ce type
de classification permet de constituer des groupes d’éléments correspondant à un certain
niveau de distance. La classification retenue a été la méthode de Ward (Rouanet & Le Roux,
1993), classification hiérarchique ascendante sur le moment d’ordre 2 (variance). La méthode
consiste à constituer des groupes d’éléments par agrégations successives d’éléments. Un
groupe est constitué par les éléments engendrant entre eux la plus faible variation d’inertie et
caractérisé par son moment d’inertie (= Somme du Carré des Ecarts au centre). L’agrégation
se fait par adjonction au groupe de l’élément (ou autre groupe) induisant la plus petite
variation d’inertie.
Ce type d’interprétation permet par ailleurs de s’affranchir du biais induit par la projection
d’un point à n dimensions (n= nombre d’axes factoriels retenus) dans un espace à 2
dimensions lors de la représentation graphique puisque le calcul prend en compte tous les
axes factoriels retenus dans l’A.F.C."


Finalement, on va même arriver à répondre à la question... comme quoi, ce forum est un vrai couteau suisse....lol

Laurent.

Dernière modification par lcadamuro (Sun 24 February 2008 22:31)

Hors ligne

 

#5 Thu 28 February 2008 10:28

rriv
Participant actif
Date d'inscription: 6 Sep 2005
Messages: 50

Re: ACP: critères d'utilisation !

Bonjour,

un papier que j'ai trouvé extrêmement intéressant sur l'ACP (en anglais, mais un tutorial de grande qualité) :
www.snl.salk.edu/~shlens/pub/notes/pca.pdf

Voir aussi 2 "compilations" de ressources sur l'analyse de données
http://eric.univ-lyon2.fr/~ricco/cours/ … ining.html
et
http://www.aiaccess.net/f_gm.htm

Bon courage

R. Rivière

Hors ligne

 

#6 Fri 29 February 2008 15:49

Ben Man
Juste Inscrit !
Date d'inscription: 23 Feb 2008
Messages: 3

Re: ACP: critères d'utilisation !

Bonjour,
Merci pour votre apport, merci à rriv pour les supers liens. Toutefois, j'ai encore une petite question...
En voulant interpréter les liaisons entre les 91 variables je me suis confronté à la difficulté de définir le seuil (X) à partir de lequel je considère que le coef. de corrélation r obtenu est significatif. ((Un vague souvenir me dit qu'il y a un tableau de probabilité ... j'arrive pas à mettre la main dessus))

Merci d'avance

Dernière modification par Ben Man (Sun 02 March 2008 16:41)

Hors ligne

 

#7 Mon 03 March 2008 12:24

alban
Participant assidu
Lieu: Chizé
Date d'inscription: 16 May 2007
Messages: 156
Site web

Re: ACP: critères d'utilisation !

Bonjour,

r te donne la nature de la corrélation entre les 2 variables.
r² définit le pouvoir explicatif de la corrélation linéaire : avec une droite, j´explique (r² * 100) % de la relation entre mes deux variables.

Les corrélations peuvent effectivement être ensuite testées, pour voir si la corrélation est ou non significative.
Si tu veux comprendre les calculs de corrélations, je te renvoie à un TP que j´ai donné (cf. Analyse bivariée (8) dans la page :
http://alban-thomas.exen.fr/pages/statGeo.php ).

Bonne chance,

Alban

Hors ligne

 

Pied de page des forums

Powered by FluxBB