Cartes
de France sur cellules hexagonales
les
phrases en italiques sont mes additions
Justification
(extrait de http://www.chataignon.net/biweight/methode.html)
Un
des défauts des représentations par commune tient à l'hétérogénéité ce
maillage en France. La taille des communes diffère énormément, par exemple
entre l'Aquitaine ou PACA et le Nord de la France. Cela peut avoir des effets gênants
: une commune de grande superficie, même peu peuplée, va avoir un effet visuel
fort. Plus embêtant : lorsque le calcul fait intervenir la superficie de la
commune, comme dans le cas de la densité de population, on peut obtenir de
fortes discontinuités entre communes voisines selon que l'on a une commune de
petite taille dont tout le territoire est bâti ou une commune qui a une forêt
très étendue sur son territoire (Haguenau, Fontainebleau...) et fait donc
apparaître une densité particulièrement faible.
Pour
éviter
ce défaut, les données sont cartographiées sur un maillage hexagonal qui présente
des caractéristiques visuelles plus intéressantes que le carroyage mais qui
entraîne des calculs plus complexes. Il faut par exemple 13212 hexagones
avec un pas de 4km pour saisir la France Métropolitaine.
Quelques
éléments de méthodologie
Pour
calculer la valeur à représenter pour chaque hexagone de ce nouveau maillage,
on applique des résultats issus des méthodes d'estimation de densité non
paramétrique. L'idée de base de ces techniques est d'estimer, à partir d'un
ensemble discret de points de l'espace affectés d'une masse, une fonction
continue. La représentation cartographique de cette fonction de densité (plus
exactement mesure de Dirac mais on utilisera le terme plus simple de densité)
fournit des cartes ayant plusieurs propriétés intéressantes.
Le
principe de l'estimation de densité selon une méthode non paramétrique est
d'estimer une fonction de densité continue, f(x), à partir d'un échantillon
discret X1..Xn supposé issu de cette loi sans faire d'hypothèses a priori sur
l'appartenance de f à une famille de lois connues. L'estimation ne concerne
donc plus un paramètre dans cette famille de loi, mais directement la fonction
elle-même (d'où le terme de non paramétrique).
L'utilisation de la méthode d'estimation par le noyau est la plus fréquente
pour estimer une densité. En résumé, on choisit un noyau, (K pour kernel)
c'est-à-dire une fonction, en général continue et de surface 1, ayant de
"bonnes propriétés" de régularité et de symétrie.
Outre le
choix d'un noyau, l'estimation de densité nécessite également le choix d'une
fenêtre, habituellement notée h.
La
statistique non paramétrique donne un certain nombre de résultats et de critères
de qualité pour apprécier la qualité de l'estimation de la densité.
Il est
largement admis (et partiellement démontré) que le choix de h a plus
d'influence que le choix de K. Parmi les noyaux usuels, l'estimation diffère
peu selon que l'on choisit un noyau gaussien ou un Biweight ; par contre le
choix de la fenêtre h est le plus important.
Recette
simplifiée pour une carte « biweight »
Carte
de France des abstentions au premier tour de l’élection présidentielle de
2002
et
une vue plus détaillée du Nord/Nord-Est montrant bien le caractère
granulaire de la cartographie de base