Cartes de France sur cellules hexagonales

 les phrases en italiques sont mes additions

Justification (extrait de http://www.chataignon.net/biweight/methode.html)

Un des défauts des représentations par commune tient à l'hétérogénéité ce maillage en France. La taille des communes diffère énormément, par exemple entre l'Aquitaine ou PACA et le Nord de la France. Cela peut avoir des effets gênants : une commune de grande superficie, même peu peuplée, va avoir un effet visuel fort. Plus embêtant : lorsque le calcul fait intervenir la superficie de la commune, comme dans le cas de la densité de population, on peut obtenir de fortes discontinuités entre communes voisines selon que l'on a une commune de petite taille dont tout le territoire est bâti ou une commune qui a une forêt très étendue sur son territoire (Haguenau, Fontainebleau...) et fait donc apparaître une densité particulièrement faible.

Pour éviter ce défaut, les données sont cartographiées sur un maillage hexagonal qui présente des caractéristiques visuelles plus intéressantes que le carroyage mais qui entraîne des calculs plus complexes. Il faut par exemple 13212 hexagones avec un pas de 4km pour saisir la France Métropolitaine.

Quelques éléments de méthodologie

Pour calculer la valeur à représenter pour chaque hexagone de ce nouveau maillage, on applique des résultats issus des méthodes d'estimation de densité non paramétrique. L'idée de base de ces techniques est d'estimer, à partir d'un ensemble discret de points de l'espace affectés d'une masse, une fonction continue. La représentation cartographique de cette fonction de densité (plus exactement mesure de Dirac mais on utilisera le terme plus simple de densité) fournit des cartes ayant plusieurs propriétés intéressantes.

 

Le principe de l'estimation de densité selon une méthode non paramétrique est d'estimer une fonction de densité continue, f(x), à partir d'un échantillon discret X1..Xn supposé issu de cette loi sans faire d'hypothèses a priori sur l'appartenance de f à une famille de lois connues. L'estimation ne concerne donc plus un paramètre dans cette famille de loi, mais directement la fonction elle-même (d'où le terme de non paramétrique).


L'utilisation de la méthode d'estimation par le noyau est la plus fréquente pour estimer une densité. En résumé, on choisit un noyau, (K pour kernel) c'est-à-dire une fonction, en général continue et de surface 1, ayant de "bonnes propriétés" de régularité et de symétrie.

 

Outre le choix d'un noyau, l'estimation de densité nécessite également le choix d'une fenêtre, habituellement notée h.

 

La statistique non paramétrique donne un certain nombre de résultats et de critères de qualité pour apprécier la qualité de l'estimation de la densité.

 

Il est largement admis (et partiellement démontré) que le choix de h a plus d'influence que le choix de K. Parmi les noyaux usuels, l'estimation diffère peu selon que l'on choisit un noyau gaussien ou un Biweight ; par contre le choix de la fenêtre h est le plus important.

 

Recette simplifiée pour une carte « biweight »

 

Carte de France des abstentions au premier tour de l’élection présidentielle de 2002

et une vue plus détaillée du Nord/Nord-Est montrant bien le caractère granulaire de la cartographie de base