#1 Mon 15 March 2010 17:24
- delvaux.helene
- Participant occasionnel
- Date d'inscription: 26 Aug 2009
- Messages: 12
Discrétisation par intervalles géométriques
Bonjour à tous,
je dispose d'une série de données que je souhaite classer en 4 classes. La distribution de mes données ayant étant très largement asymétrique à gauche, j'ai donc retenu la méthode de classification par intervalles géométrique de arcview qui semble la plus adaptée pour ce type de répartition. Après plusieurs recherches sur cette méthode de discrétisation il semble que le calcul réalisé pour obtenir les intervalles de classes est le suivant:
intervalle 1: n x r
intervalle 2: (n x r) x r
intervalle 3: ((n x r) x r) x r
et ainsi de suite... avec n = la valeur minimale de la série de données
et r = 10 exposant [(log (valeur max) – log (valeur min)) / nb classes]
Or les intervalles définis automatiquement par arcview lors de l'application de cette méthode de discrétisation ne correspondent pas du tout à ceux que l'on obtiendrai en appliquant le calcul ci-dessus...
Quelqu'un peut-il m'éclairer sur cette différence? Quel calcul arcview applique t'il?
Merci!
Hors ligne
#2 Mon 15 March 2010 17:47
- cartomdf
- Participant occasionnel
- Lieu: 73000
- Date d'inscription: 7 Jan 2008
- Messages: 25
Re: Discrétisation par intervalles géométriques
Bonjour,
As tu jeté un oeil à l'aide d'ESRI sur le sujet?
http://webhelp.esri.com/arcgisdesktop/9 … l_interval
"The algorithm creates these geometrical intervals by minimizing the square sum of element per class. This ensures that each class range has approximately the same number of values with each class and that the change between intervals is fairly consistent. "
Cela n'a donc pas l'air d'être vraiment une discrétisation liée à la progression géométrique où les amplitudes des intervalles augmentent géométriquement.
Maeve
Hors ligne
#3 Mon 15 March 2010 21:42
- delvaux.helene
- Participant occasionnel
- Date d'inscription: 26 Aug 2009
- Messages: 12
Re: Discrétisation par intervalles géométriques
Merci Maeve mais la définition d'arcgis desktop ne m'éclaire pas vraiment plus...
De plus au vu des intervalles que arcview me calcule, cela ne me semble pas vraiment correspondre non plus à l'explication (plus que succinte) d'arcgis desktop.
En effet, je dispose de 115 valeurs, toutes des nombres entiers variant de 2 à 20. La répartition de mes valeurs est très asymétrique gauche: j'ai un grand nombre de valeurs égales à 2 ou à 3, puis une répartition décroissante vers les plus fortes valeurs.
Or voici les intervalles que me calcule arcview:
intervalle 1: 2
intervalle 2: 3
intervalle 3: 4-7
intervalle 4: 8-20
Curieux comme découpage non?
Mon objectif est d'obtenir la classification en 4 classes la plus pertinente pour des données à distribution très asymétrique vers la gauche.
Hors ligne
#4 Mon 15 March 2010 22:44
- Damien BEAUSEIGNEUR
- Participant assidu
- Lieu: meyzieu
- Date d'inscription: 5 Sep 2005
- Messages: 425
Re: Discrétisation par intervalles géométriques
je trouve pas, vu ce que tu raconte c'est normal, puisqu'il faut obtenir le même nombre d'élément par classe.
Justement, il y a toujours la solution d'utiliser une classification par intervalle constant, et la on verra bien le phénomène que tu décris.
Mais si le but est de voir les différences entre les valeurs très fréquentes le découpage proposé par arcgis est la meilleure il me semble.
Hors ligne
#5 Tue 16 March 2010 09:48
- delvaux.helene
- Participant occasionnel
- Date d'inscription: 26 Aug 2009
- Messages: 12
Re: Discrétisation par intervalles géométriques
Je suis désolée mais je suis encore plus embrouillée...
"je trouve pas, vu ce que tu raconte c'est normal, puisqu'il faut obtenir le même nombre d'élément par classe"
Mais la classification d'arcgis (intervalles géométrique) ne donne pas du tout le même nombre d'éléments par classe!!! Pour l'intervalle 1 (valeurs égales à 2) j'ai 36 valeurs, pour l'intervalle 2 j'ai 17 valeurs, pour l'intervalle 3 42 valeurs et le 4e intervalle 20 valeurs!
Si j'avais voulu le même nombre d'éléments par classe j'aurai choisi la méthode de classification des effectifs égaux de arcgis.
Or il me semble que cette méthode n'est pas du tout adaptée à une distribution des données asymétrique.
Peut être que je n'ai pas assez clairement expliqué mon problème:
je dispose d'une série de données asymétriques (voir pj) que je veux classer en 4 classes, les plus pertinentes possibles étant donné que j'ai une très forte représentation dans les faibles valeurs.
Est ce que quelqu'un peut-il déjà me confirmer que la classification par intervalles géométriques est la plus adaptée pour ce type de distribution?
Je me demandais ensuite sur quel calcul arcgis se basait pour calculer ses intervalles, puisqu'ils ne semblent ni correspondre aux formules habituellement données pour les intervalles géométriques, ni à un même nombre de valeurs par intervalles, ni à des amplitudes d'intervalles similaires (comme le laisserait penser arcgis desktop)...
Merci encore de votre aide!
Hors ligne