Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considèrerons que vous acceptez l'utilisation des cookies. J'ai compris ! ou En savoir plus !.
banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

Annonce

Suite à un problème technique intervenu entre le 22 et le 23 mars, nous avons du procéder dans la soirée du 25 mars, à la restauration de la base de données du 24 mars (matinée).

En clair, nous avons perdu vos contributions et inscriptions du dimanche 24 et du lundi 25 mars.
Nous vous prions de nous excuser.

#61 Sat 04 September 2021 11:06

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

Il y a plein de dénominations dans la base SIRENE...
- celle(s) de l'unité légale, c'est à dire la personne morale, l'entreprise ce qui peut inclure le nom personnel pour les entreprises individuelles (denominationunitelegale, denominationusuelle1unitelegale, denominationusuelle2unitelegale, denominationusuelle2unitelegale + nomunitelegale, nomusageunitelegale, prenom1unitelegale...)
- celle(s) des établissements, y compris des noms "d'enseigne' (enseigne1etablissement, enseigne2etablissement, enseigne3etablissement, denominationusuelleetablissement)

Tout dépend de ce qu'on veut comme "nom"...

Moi aussi j'ai du mal à m'y retrouver parfois, mais la réalité est complexe, l'INSEE ne fait que l'enregistrer wink


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#62 Mon 06 September 2021 14:24

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 981

Re: SIRENE géocodée... infos et discussions

Merci pour ta réponse Christian,

cquest a écrit:

Tout dépend de ce qu'on veut comme "nom"...


Ok, je comprends bien le principe : mais j'ai beau chercher dans tous les champs disponibles du fichier StockEtablissement_utf8_geo.csv, aucun champ ne comporte la dénomination qui apparait pourtant sur les différents sites et dans le résultats des moteurs de recherche.

Je travaille actuellement sur la thématique équestre, alors voici un exemple :
https://www.qwant.com/?q=513778159+siren
Le nom de l'EURL (je ne l'écris pas ici je ne fais pas de pub) apparait bien en ligne, mais dans aucun des champs du CSV...
Faut-il croiser avec d'autres fichiers ?


Sylvain M.

Hors ligne

 

#63 Mon 06 September 2021 17:48

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

Le nom de l'entreprise (qui n'a qu'un établissement, son siège) est dans denominationunitelegale qui se trouve dans le fichier StockUniteLegale_utf8.zip diffusé par l'INSEE.

Ce fichier n'est pas géocodé vu qu'il ne contient aucune info géographique/adresse, uniquement des infos sur la personne morale, la géo c'est liés aux établissements (dont le siège).

Par contre, je vois qu'en effet je ne met pas de copie de ce fichier à côté de l'autre... je vais l'ajouter pour ne pas avoir à le chercher wink


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#64 Tue 07 September 2021 08:25

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 981

Re: SIRENE géocodée... infos et discussions

Ah, chouette : c'est tout de suite plus clair !
Merci Christian pour tes explications, et pour tout le travail d'archivage / mise à disposition ! big_smile


Sylvain M.

Hors ligne

 

#65 Thu 14 October 2021 09:25

thewild
Juste Inscrit !
Date d'inscription: 14 Jan 2019
Messages: 4

Re: SIRENE géocodée... infos et discussions

Bonjour à tous, et merci Christian pour ces bases géocodées !

Petite question : J'utilise la base géocodée présente dans https://files.data.gouv.fr/geo-sirene/, est-ce un dérivé de la tienne ? Je n'arrive pas à trouver qui est le responsable de ces données.
Je me permets de demander ici, car le dernier millésime (octobre 2021) a un gros problème de positionnement. Un exemple, parmi d'autres : 42047736600033. Positionné au milieu des Vosges (au sommet du "Haut du Rouge Gazon"), alors que c'est un établissement à proximité de Metz (rue "Haut Gazon" à Moulins-Les-Metz).
L'algorithme de géocodage semble avoir changé, mais il y a beaucoup de matchs incorrects qu'il n'y avait pas avant. Pour septembre je ne suis pas sûr, mais il y a quelques mois c'est certain qu'il n'avait pas tous ces positionnements étranges.

Désolé si je ne suis pas au bon endroit, mais j'avais cru comprendre dans un post quelque part que l'INSEE utilisait probablement le géocodage de Christian en interne... wink

Hors ligne

 

#66 Thu 14 October 2021 09:41

thewild
Juste Inscrit !
Date d'inscription: 14 Jan 2019
Messages: 4

Re: SIRENE géocodée... infos et discussions

Et pour apporter ma petite pierre à l'édifice, pour ceux qui sont sous Windows on peut facilement charger de gros fichiers compressés dans PostgreSQL en passant une commande batch comme argument à COPY. MA commande de chargement de la table SIREN :

Code:

COPY siren FROM PROGRAM '"C:\Program Files\7-Zip\7z.exe" e -so D:\Temp\StockUniteLegale_utf8.zip"' CSV HEADER NULL '';

Très efficace, et ça permet d'éviter les erreurs "could not stat file" pour le chargement de très gros fichiers dans PostgreSQL (>4Go) sous Windows.

Hors ligne

 

#67 Fri 15 October 2021 09:24

geoffreyaldebert
Juste Inscrit !
Date d'inscription: 15 Oct 2021
Messages: 2

Re: SIRENE géocodée... infos et discussions

Bonjouf @thewild,

Je réponds à votre message concernant la base géocodée hébergée sur files.data.gouv.fr. C'est côté Etalab que nous générons celle-ci et nous comptons communiquer dessus courant novembre avec un jeu de données dédié sur data.gouv.fr

Pour les problèmes que vous soulignez, c'est effectivement possible qu'il y ait des mauvais géocodages, nous sommes en effet parti du code de cquest pour y arriver mais nous avons apporter quelques modifications, comme la stratégie de détection des adresses.

En loccurence sur l'exemple que vous avancez, il s'agit d'une détection via la base des POI OSM qui est manifestement fausse. En vérifiant pour cette exemple sur les précédentes versions, le même géocodage est attribué donc il ne s'agit a priori pas d'une modification de ce millésime pour cet exemple.

Je serai intéressé d'échanger avec vous sur les autres erreurs constatées, s'agit-il toujours de géocodage provenant de la base POI ?

Vous pouvez me contacter via mon prenom . nom arobase data.gouv.fr

Bonne journée, Geoffrey Aldebert

Hors ligne

 

#68 Fri 15 October 2021 11:34

thewild
Juste Inscrit !
Date d'inscription: 14 Jan 2019
Messages: 4

Re: SIRENE géocodée... infos et discussions

Bonjour Geoffrey, et merci pour cette réponse !
En fait j'ai peut-être été un peu vite en affirmant que le problème était nouveau, mais je suis tombé sur pas mal de cas hier ce qui m'a interpelé, cela n'arrivait que rarement auparavant.
Hier j'ai vidé la table "etalab" pour la remplacer par celle du serveur de cquest, il faudra donc que je la recharge pour l'analyser.
A priori, un simple test savoir si le point géocodé se trouve à l'intérieur de la commune de l'établissement renverra déjà énormément d'erreurs. Je pars du principe (peut-être à tort, mais je connais encore mal ces bases) que le codecommuneetablissement de la table des établissements actifs est fiable.

Hors ligne

 

#69 Fri 15 October 2021 13:40

gbodet
Participant occasionnel
Lieu: Compiègne
Date d'inscription: 28 Sep 2005
Messages: 49

Re: SIRENE géocodée... infos et discussions

Bonjour,

Notre collectivité utilise depuis longtemps la base de données SIRENE. Nous utilisons l'API de SIRENE pour nos mises à jour trimestrielles.
Pour la géolocalisation des établissements, nous utilisons notre base adresse locale comme référentiel géographique et nous reconstruisons une adresse conforme depuis SIRENE pour la liaison.
L'adressage SIRENE, même si il s'est amélioré, reste indicatif et non normé donc il y a un certain nombre d'erreurs.

En moyenne, pour environ 400 nouveaux établissements par trimestre, 30% ne sont pas géocodés automatiquement, du fait d'une mauvaise saisie des adresses dans SIRENE. Après une passe manuelle, nous estimons entre 4 et 6% d'établissements restant non géolocalisables. Il s'agit ici d'établissements dont l'adresse n'existe pas ou plus, ou une adresse non conformes (sans n° de voie par exemple).

Cordialement

Hors ligne

 

#70 Fri 15 October 2021 15:16

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

thewild a écrit:

Bonjour à tous, et merci Christian pour ces bases géocodées !

Petite question : J'utilise la base géocodée présente dans https://files.data.gouv.fr/geo-sirene/, est-ce un dérivé de la tienne ? Je n'arrive pas à trouver qui est le responsable de ces données.
Je me permets de demander ici, car le dernier millésime (octobre 2021) a un gros problème de positionnement. Un exemple, parmi d'autres : 42047736600033. Positionné au milieu des Vosges (au sommet du "Haut du Rouge Gazon"), alors que c'est un établissement à proximité de Metz (rue "Haut Gazon" à Moulins-Les-Metz).
L'algorithme de géocodage semble avoir changé, mais il y a beaucoup de matchs incorrects qu'il n'y avait pas avant. Pour septembre je ne suis pas sûr, mais il y a quelques mois c'est certain qu'il n'avait pas tous ces positionnements étranges.

Désolé si je ne suis pas au bon endroit, mais j'avais cru comprendre dans un post quelque part que l'INSEE utilisait probablement le géocodage de Christian en interne... wink


Ce SIRET n'a sûrement pas aboutit à un géocodage car c'est un lieu dit, absent de la BAN (sûrement sans numéro).

Le résultat (dans mon géocodage, donc sur data.cquest.org) était "correct" jusque juin dernier, et ne provient pas des POI OSM, mais de BANO qui contient les positions des lieux-dits... par contre depuis juillet, plus rien, j'ai sûrement cassé quelque chose sad

Sur la qualité des adresses dans SIRENE, le problème c'est qu'il n'y a pas à ma connaissance de circuit pour signaler  les problèmes à l'INSEE en vue de les corriger.
En travaillant ces dernières semaines sur la base FINESS, j'ai trouvé des adresses d'établissements de santé où SIRENE n'avait qu'un nom de rue alors que FINESS a bien aussi un numéro et que celui-ci est correct (j'ai vérifi" dans OSM la localisation d'un cas qui était un EHPAD).

Donc tout le monde constate des erreurs, les corrige comme il peut de son côté, mais ça ne remonte jamais à la source, ne profite donc à personne et c'est à refaire à chaque mise à jour... quelle énergie perdue !

Pour la fiabilite du codecommuneetablissement, je pense qu'on peut partir du principe que c'est bon... en tout cas, je l'utilise dans mes scripts pour limiter le géocodage uniquement dans la commune.

Dernière modification par cquest (Fri 15 October 2021 15:19)


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#71 Sun 17 October 2021 14:58

Bruno
Membre du bureau
Lieu: Toulouse
Date d'inscription: 22 Jun 2005
Messages: 11727
Site web

Re: SIRENE géocodée... infos et discussions

Bonjour,

C'est dommage que nous ne lisions pas l'INSEE sur GeoRezo, car nous apprendrions peut-être qu'ils ont un projet pour spatialiser nativement (géocoder à l'adresse) la base de données des entreprises. On peut raisonnablement imaginer le temps passé par les uns et les autres (éventuellement certaines directions en interne à l'INSEE...) pour spatialiser une base de données de ce type.
Peut-être ont-ils entendu parler de la BAN, même avec ses limites actuelles.

Mais l'INSEE dispose-t-il d'un "service SIG"?

Bon dimanche!

Hors ligne

 

#72 Mon 18 October 2021 09:43

jdesboeufs
Participant assidu
Lieu: Paris
Date d'inscription: 11 Jun 2012
Messages: 156

Re: SIRENE géocodée... infos et discussions

L'INSEE dispose d'un service dédié aux données géographiques pour leurs besoins propres. Je n'irai pas jusqu'à dire que c'est un service SIG car je ne le connais pas en détails.
À ma connaissance le rapprochement BAN est dans leur feuille de route mais plutôt horizon 2023.
Il faudra donc un peu de patience et en attendant se contenter de ce qui existe déjà smile


Jérôme Desboeufs / Living Data
ex-BAN ex-Etalab

Hors ligne

 

#73 Sat 23 October 2021 10:31

geoffreyaldebert
Juste Inscrit !
Date d'inscription: 15 Oct 2021
Messages: 2

Re: SIRENE géocodée... infos et discussions

Pour répondre à @thewild suite à investigation,

Nous avons côté Etalab purgé notre cache, ce qui semble régler quelques problèmes signalés. Par contre, pour certaines adresses comme celle mentionnées dans le fil, effectivement il y a des limites sur la possibilité de géocodage à partir des adresses, possiblement posant problème, fournies par la base SIRENE elle-même.

Je confirme le point de @jdesboeufs concernant l'horizon 2023 côté INSEE.

Bonne journée,
Geoffrey

Hors ligne

 

#74 Mon 14 February 2022 18:34

Ana_
Juste Inscrit !
Date d'inscription: 14 Feb 2022
Messages: 2

Re: SIRENE géocodée... infos et discussions

Bonjour à tous,

J'ai parcouru ce post et plusieurs autres posts sans trouver de réponse à ma question :
Existe t-il une façon simple d'associer les données géocodées de la BD SIRENE avec la couche bâti de la BD Topo ?

Pour le moment je n'ai pas trouvé de façon simple et rapide de les associer et je travaille sur une très grande zone d'étude.

Si vous avez déjà dû faire cette manipulation, votre réponse m'intéresse.

Vous remerciant par avance, Anaïs

Hors ligne

 

#75 Mon 14 February 2022 19:29

Elise
Participant assidu
Lieu: Argentat (19)
Date d'inscription: 16 Oct 2005
Messages: 490
Site web

Re: SIRENE géocodée... infos et discussions

Bonjour,

La couche bâti n'étant pas dotée d'un identifiant de type BAN (comme l'évoque Bruno plus haut), je ne vois qu'un import barbare depuis la feuille du tableur et la création de points à partir des coordonnées X,Y. Cela dit, si la localisation des établissements est plus ou moins précises, elle ne va pas jusqu'à pointer pile sur les bâtiments de la bd topo pour espérer faire une requête géographique en suivant ! Y'a même pas mal d'établissements qui sont géolocalisés au centroïde de la commune !

Mon expérience date d'il y a déjà 2 ou 3 ans, peut-être que les coordonnées des établissements sont aujourd'hui mieux définies.

Cordialement,
Elise


Géoscope
  11 rue de l'Hospice - 19400 Argentat
  Tél. : 09 60 47 51 16

Hors ligne

 

#76 Tue 15 February 2022 09:17

n314
Participant assidu
Date d'inscription: 6 Sep 2005
Messages: 692

Re: SIRENE géocodée... infos et discussions

Egalement, le géocodage affecte un XY à une adresse, mais la boite aux lettres n'est pas toujours dans le bâti wink

Hors ligne

 

#77 Tue 15 February 2022 12:28

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

Le lien adresse > parcelle peut s'obtenir à partir de ADRESSE PREMIUM.

Ensuite parcelle > bâti ça doit pouvoir se faire par les géométries.

Le plus délicat reste la première étape de rapprochement entre les adresses textuelles de la base Sirene saisies sans s'appuyer sur un référentiel bien clair et partagé, et un référentiel d'adresses.

Le géocodage que je fais jongle avec plusieurs bases pour obtenir une localisation plus ou moins exacte: la BAN, BANO, les POI d'OpenStreetMap (quand l'adresse dans SIRENE est "HOTEL DE VILLE" ou "CENTRE COMMERCIAL").

Les adresses de SIRENE et le geocodage s'améliorent petit à petit.

Il faut aussi prendre en compte les changements d'adresses que les entreprise n'ont pas toujours fait... car c'est payant au greffe.


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#78 Tue 15 February 2022 15:03

Ana_
Juste Inscrit !
Date d'inscription: 14 Feb 2022
Messages: 2

Re: SIRENE géocodée... infos et discussions

Bonjour,

Merci pour vos réponses, je ne connais pas adresse premium, je vais y jeter un œil.
C'est sûr qu'il y aura des erreurs car certaines entreprises n'ont pas la bonnes adresses, mais si cela peut m'avancer ça serait super car avec 7000 entreprises ça risque d'être très long de trouver leur bonne localisation à la main.

Si je trouve une solution miracle, je n'hésiterai pas à vous dire comme j'ai fait !

Anaïs

Hors ligne

 

#79 Tue 15 February 2022 15:16

Elise
Participant assidu
Lieu: Argentat (19)
Date d'inscription: 16 Oct 2005
Messages: 490
Site web

Re: SIRENE géocodée... infos et discussions

cquest a écrit:

Il faut aussi prendre en compte les changements d'adresses que les entreprise n'ont pas toujours fait... car c'est payant au greffe.


C'est payant, mais c'est obligatoire. Si elles "oublient", le greffe peut les contraindre avec une procédure au tribunal... je le sais, j'y ai eu droit pour mes comptes annuels !


Géoscope
  11 rue de l'Hospice - 19400 Argentat
  Tél. : 09 60 47 51 16

Hors ligne

 

#80 Thu 17 February 2022 17:43

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

Oyez oyez !!!

L'INSEE a publié une version géolocalisée de SIRENE !

https://www.data.gouv.fr/fr/datasets/ge … tistiques/

Publié le 14 février avec plein d'amour pour la Saint Valentin smile

Je vous laisse comparer avec ce que je fais depuis plus de 5 ans dans ma cave.


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#81 Thu 17 February 2022 17:58

tevrard
Participant assidu
Date d'inscription: 23 May 2016
Messages: 319

Re: SIRENE géocodée... infos et discussions

cquest a écrit:

Oyez oyez !!!

L'INSEE a publié une version géolocalisée de SIRENE !

https://www.data.gouv.fr/fr/datasets/ge … tistiques/

Publié le 14 février avec plein d'amour pour la Saint Valentin smile

Je vous laisse comparer avec ce que je fais depuis plus de 5 ans dans ma cave.


Merci pour la veille !



Juste une petite question : Monsieur Quest, que faites-vous depuis plus de 5 ans dans votre cave pour la Saint-Valentin?????

[blagounette /off]

Hors ligne

 

#82 Thu 17 February 2022 18:19

Elise
Participant assidu
Lieu: Argentat (19)
Date d'inscription: 16 Oct 2005
Messages: 490
Site web

Re: SIRENE géocodée... infos et discussions

cquest a écrit:

Je vous laisse comparer avec ce que je fais depuis plus de 5 ans dans ma cave.


Dans ta cave, tu ne découpes pas le fichier par département par hasard ? ;-)
Mon ordi n'est pas vieux (2 ou 3 ans), mais ça mouline, ça mouline... pour ouvrir sous qgis :-(

Elise


Géoscope
  11 rue de l'Hospice - 19400 Argentat
  Tél. : 09 60 47 51 16

Hors ligne

 

#83 Thu 17 February 2022 18:39

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

Dans ma cave, je débite SIRENE:
- par actif/fermés: https://data.cquest.org/geo_sirene/v2019/last/
- par départements: https://data.cquest.org/geo_sirene/v2019/last/dep/
- par commune: https://data.cquest.org/geo_sirene/v2019/last/communes/

Et puis j'ai même une API REST/JSON (mais pas toujours à jour): https://github.com/cquest/geo_sirene_as_api


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#84 Thu 17 February 2022 18:43

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 835

Re: SIRENE géocodée... infos et discussions

tevrard a écrit:

Juste une petite question : Monsieur Quest, que faites-vous depuis plus de 5 ans dans votre cave pour la Saint-Valentin?????
[blagounette /off]


C'est tous les jours la Saint Valentin dans ma cave pour les amoureux de la data !


Christian Quest - @cq94 sur twitter
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de @opendatArchives, OpenEventDatabase

Hors ligne

 

#85 Thu 06 April 2023 13:26

othx
Participant occasionnel
Date d'inscription: 20 Apr 2020
Messages: 10

Re: SIRENE géocodée... infos et discussions

Bonjour,
Je cherche à exploiter la base SIRENE.
Je recherche l'évolution de nombre de commerces alimentaires. Je travaille avec le langage R.
J'aimerais proposer des lignes de code pour avois vos commentaires. Est-ce le bon endroit ?
Merci

Hors ligne

 

#86 Thu 23 November 2023 14:50

lothebroke
Juste Inscrit !
Date d'inscription: 20 Jun 2023
Messages: 8

Re: SIRENE géocodée... infos et discussions

Rebonjour la team.

Hors ligne

 

#87 Thu 23 November 2023 14:50

lothebroke
Juste Inscrit !
Date d'inscription: 20 Jun 2023
Messages: 8

Re: SIRENE géocodée... infos et discussions

Rebonjour la team.

Hors ligne

 

Pied de page des forums

Powered by FluxBB