Le portail francophone de la géomatique

Epipactis · Mon 22 October 2018 14:05

Bonjour à tous,

J'ai donc une couche d'entrée contenant 300 000 données. L'un de ces champs ("Nom") est un champ texte contenant environ 300 chaînes de caractères différentes. Quand j'affiche toutes les données sur la carte, on n'y voit plus rien car elles se recouvrent toutes les unes les autres.

Je cherche donc à supprimer les données ayant la même valeur dans un champ texte si ces données sont trop proches géographiquement.

Pour essayer d'automatiser le nettoyage des données, j'ai essayé en utilisant le modeleur de traitements.
- Je crée d'abord une matrice de distance pour cette couche.
- Ensuite, je sélectionne dans cette matrice toutes les distances inférieures à une certaine valeur (nommons la D).
- Je joins ensuite à la matrice la valeur du champ "Nom" correspondant à chaque ID de la matrice.
- Je me retrouve avec une table de type "InputID","TargetID", "Distance", "NomID1", "NomID2".
- Je sélectionne alors les données répondant aux critères suivant : "NomID1" = "NomID2" ET "DIstance" < D.
- Je me retrouve alors avec une liste de mes valeurs en double et proches géographiquement.

Cependant, je ne sais pas comment ensuite dire à QGis de conserver une seule des valeurs en double proches (j'ai parfois 5 valeurs en double proche).
De plus, dans cette table des "presque doublons", chaque doublon apparaît 2 fois, une fois avec l'identifiant de l'une des données en "InputID" et celui de l'autre donnée en "TargetID", et une seconde fois avec les identifiants inversés (le premier dans "TargetID" et le second dans "InputID").

Voilà, si vous pouvez me dépanner je suis preneur J'espère que mes explications sont assez claires.

Merci d'avance !

Dernière modification par Epipactis (Mon 22 October 2018 15:07)

Communauté	Ressources	L'emploi	Le marché	L'association	Fils RSS
Forum Blogs Wiki Planet Sites amis	Agenda Biblio Fiches AMO-CNIG Paris PCGIS Téléchargements	Offres d'emploi Banque de CV Formations Démarche Métiers	Geo-Entreprises Geo-Communiqué Appels d'offres	L'association Qui sommes-nous ? Nous aider Bienfaiteurs Partenaires Historique Statuts	Tout le site Job Géomatique Services GeoBlogs ...	Faire un don Mentions légales

Le portail francophone de la géomatique

Annonce

Les inscriptions sont ouvertes ! L'association GeoRezo sera présente

#1 Mon 22 October 2018 14:05

QGIS 3.0: Suppression de "presque doublons"

Pied de page des forums