banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

#1 Thu 26 October 2017 21:13

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

SIRENE géocodée... infos et discussions

J'ouvre un fil de discussion dédiée à la version géocodée de SIRENE avec quelques infos fraîches.

Jusqu'à maintenant, ce géocodage s'appuyait sur les bases BAN et BANO et je suis en train de finaliser l'ajout d'une troisième source: les POI d'OpenStreetMap.

Pourquoi ?

Dans la liste des adresses ne pouvant être géocodées, un bon nombre correspond à un point d'intérêt et pas à une adresse.

Quelques exemples:
- MAIRIE, LA MAIRIE, HOTEL DE VILLE
- PALAIS DE JUSTICE, GARE, LA GARE
- CENTRE COMMERCIAL MACHINCHOSE
- AEROPORT DE TATAOUINE
- CHATEAU DE BIDULLE, FORT DE TRUC
etc...

Depuis déjà un certain temps, j'ai monté une instance d'addok avec comme référentiel les POI extraits d'OpenStreetMap et reformatés pour être injectés dans le géocodeur addok. Les scripts qui préparent les données sont sur https://github.com/osm-fr/osmpoi4addok

Pour les adresses non trouvées dans BAN et BANO, j'ajoute donc une étape en plus, très efficace pour les mairies et les centres commerciaux où beaucoup d'établissements sont localisés.

Le 'type' commence dans ce cas par 'poi', exemple: poi.townhall pour une mairie, poi.mall pour un centre commercial, etc
L'id est le lien vers l'objet OpenStreetMap, exemple: http://osm.org/way/113312454


Pour résumer, voici les colonnes ajoutées par le géocodage:
- longitude: longitude de l'adresse trouvée (en degrés décimaux WGS84)
- latitude: latitude de l'adresse trouvée (en degrés décimaux WGS84)
- geo_score: score de 0 à 1 de confiance du géocodage (plus il est élevé plus on a de chance d'avoir trouvé ladresse)
- geo_type: type d'adresse trouvée housenumber= au numéro, street= à la rue, locality= au lieu-dit, municipality = à la commune, poi= point d'intérêt
- geo_adresse: version textuelle de l'adresse trouvée, ex: 20 avenue de Ségur 75007 Paris
- geo_id: identifiant de cette adresse dans la base source où elle a été trouvée
- geo_ligne: quelle ligne d'adresse de la base SIRENE a pu être géocodée (G=géographique, D=déclarée, N = normalisée)
- geo_l4: ligne 4 à la norme AFNOR adresse
- geo_l5: ligne 5 à la norme AFNOR adresse

Dernière modification par cquest (Fri 04 January 2019 12:58)


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#2 Fri 27 October 2017 08:58

Robin
GeoRezo forever
Lieu: France
Date d'inscription: 31 Aug 2005
Messages: 13614
Site web

Re: SIRENE géocodée... infos et discussions

Merci Christian pour tout ce travail - inestimable. J'ai hâte de voir ce que ça va donner !

Hors ligne

 

#3 Fri 27 October 2017 09:45

Raphaël_
Participant actif
Date d'inscription: 18 Jan 2016
Messages: 110

Re: SIRENE géocodée... infos et discussions

Merci bien ! smile

Hors ligne

 

#4 Thu 02 November 2017 14:46

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Avis à la population !

Le stock SIRENE à fin octobre géocodé est dispo: http://data.cquest.org/geo_sirene/last/

Bases utilisées:
- BAN du 30/10/2017
- BANO du 01/11/2017
- POI OSM du 26/10/2017

Un peu de lecture sur les nouveautés est disponible sur: https://medium.com/@cq94/g%C3%A9ocodage … 0e14e87a8d

Dernière modification par cquest (Wed 07 March 2018 18:48)


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#5 Sat 06 January 2018 15:32

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

La version géocodée de SIRENE au 1/1/2018 est disponible...

http://data.cquest.org/geo_sirene/2017-12/

Dernière modification par cquest (Wed 07 March 2018 18:49)


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#6 Tue 09 January 2018 15:10

Theos2000
Participant assidu
Date d'inscription: 15 Jun 2015
Messages: 221

Re: SIRENE géocodée... infos et discussions

(Risque de Hors sujet)
Travail titanesque mais o combien utile. Merci beaucoup...
A quand l'intégration des données Sirène dans OpenstreetMap ??? 
Car il semble que Google l'ai déjà fait sur certains territoires ...

Hors ligne

 

#7 Tue 09 January 2018 15:37

PA
Membre
Lieu: Paris
Date d'inscription: 5 Sep 2005
Messages: 3259
Site web

Re: SIRENE géocodée... infos et discussions

Une partie seulement peut-être car ça ne décrit pas le territoire, contrairement aux commerces visibles avec enseigne.


Pierre-André Le Ny
Modérateur QGIS, Données, Coin de l'OpenSource
Aidez l'association GeoRezo !

Hors ligne

 

#8 Tue 09 January 2018 17:50

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Il y a quelques tests qui ont été fait sur les pharmacies (un de mes TOC).

Le besoin de contrôle est réel car des établissements ne sont pas à l'adresse déclarée, ils peuvent aussi ne plus être en activité (en cours de liquidation).

SIRENE permet par contre de détecter plus rapidement des changements car un nouveau commerce figure dans SIRENE en général avant même d'ouvrir.


Autre usage de SIRENE... un géocodeur de POI. J'ai chargé une instance d'addok (le géocodeur d'Etalab derrière adresse.data.gouv.fr) avec les commerces de SIRENE, accessible pour test sur http://sirene.addok.xyz/


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#9 Tue 20 February 2018 17:51

Lucas06
Juste Inscrit !
Lieu: Cannes
Date d'inscription: 5 Feb 2018
Messages: 2
Site web

Re: SIRENE géocodée... infos et discussions

La charge de travail doit vraiment être colossale, tout autant que l'intérêt du travail en lui-même.

Merci beaucoup à vous de contribuer (aussi fortement) à cette démarche de partage et de démocratisation des données.

Hors ligne

 

#10 Wed 28 February 2018 21:46

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Pour les utilisateurs de la base SIRENE, je viens d'ajouter sur data.gouv.fr un petit retraitement des fichiers de mise à jour quotidien: la liste des changements de codes SIRET.

C'est par exemple le cas lorsqu'une entreprise déménage... donc plutôt utile.

Les scripts de traitement sont sur: https://github.com/cquest/histo_sirene

Les données extraites par ces scripts sont téléchargeables sur http://data.cquest.org/histo_sirene/

Ce sont des fichiers CSV très simples:
- ancien code SIRET
- nouveau code SIRET
- date du changement

Il y a un fichier pour chaque mise à jour quotidienne de SIRENE et un fichier de cumul annuel et si j'ai tout bien configuré ça devrait se mettre à jour tout seul vers 10h du matin... à vérifier demain wink

L'historique démarre en janvier 2017, date depuis laquelle la base SIRENE et ses mises à jour sont en opendata.

Dernière modification par cquest (Wed 07 March 2018 18:49)


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#11 Wed 28 February 2018 23:01

Bruno
Membre du bureau
Lieu: Toulouse
Date d'inscription: 22 Jun 2005
Messages: 11929
Site web

Re: SIRENE géocodée... infos et discussions

Christian,

Existe-t-il un espoir que Pôle emploi s'appuie sur ce travail pour localiser les offres d'emplois dans une carto dynamique ouverte (pour le grand public)?
Peut-être cela existe-t-il déjà...

Bruno

Hors ligne

 

#12 Wed 28 February 2018 23:08

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Aucune idée, par contre, il y a des usages dans le domaine de l'emploi tel que https://labonneboite.pole-emploi.fr/ où la géoloc est utilisée.

La Bonne Boite effectue un ciblage spécifique des entreprises à fort potentiel d’embauche afin de faire gagner du temps dans la sélection des entreprises à démarcher.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#13 Thu 01 March 2018 21:33

Bruno
Membre du bureau
Lieu: Toulouse
Date d'inscription: 22 Jun 2005
Messages: 11929
Site web

Re: SIRENE géocodée... infos et discussions

Merci, c'est malin.
J'imagine que les contrats en alternance ne sont pas comptés dans les ETP de la fonction publique...

Hors ligne

 

#14 Wed 04 April 2018 15:48

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Géocodage mensuel de SIRENE fait... et j'en profite pour signaler un changement d'adresse.

Une URL stable (data.cquest.org) remplace désormais l'IPv4 qui était utilisée et donc cela donne: http://data.cquest.org/geo_sirene/

Vous trouverez pas mal d'autres données utiles sur ce serveur.

J'ai par exemple ajouté le fameux carroyage à 200m de l'INSEE sous forme de shapefile prêts à l'emploi, plus pratiques que les données MIF/MID+DBF publiées par l'INSEE: http://data.cquest.org/insee_carroyage/

Le but est aussi de conserver des archives là où c'est pertinent.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#15 Fri 06 April 2018 12:53

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Retour sur la base SIRENE géocodée...

J'ai ajouté le géocodage des fichiers de mise à jour (quasi quotidiens).

Ils sont ici: http://data.cquest.org/geo_sirene/quotidien/

Le géocodage des anciens fichiers est en cours, la liste va donc petit à petit s'allonger en remontant dans le passé...


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#16 Fri 27 April 2018 18:02

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Petit changement à prévoir dans le fichier "stock" géocodé en début de mois...

J'avais éliminé certaines colonnes redondantes (les libellés des catégories, les liens entre commune, département, région, EPCI).
J'ai tout remis pour être cohérent avec les fichiers quotidiens et rester au plus proche des fichiers d'origine, même si ça gonfle un peu au final la taille des fichiers.

Si vous voulez voir ce que ça donne, c'est sur: http://data.cquest.org/temp/

A partir du prochain stock, ça sera publié à l'emplacement habituel.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#17 Wed 02 May 2018 09:48

Jean-Michel
Membre
Lieu: An Oriant /Lorient
Date d'inscription: 3 Oct 2005
Messages: 3909

Re: SIRENE géocodée... infos et discussions

Bonjour et Merci Christian,
Voir également cette initiative : https://github.com/ColinMaudry/sirene-ld
(Transformation du répertoire SIRENE (CSV) au format RDF pour publication en Linked Data )


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#18 Thu 21 June 2018 08:21

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Petit changement à partir d'aujourdhui...

Depuis le 21 juin 2018, l'INSEE n'effectuant plus de traitement RNVP sur la base SIRENE, deux colonnes (geo_l4 et geo_l5) issues du géocodage ont été ajoutées pour partiellement pallier ce changement.
Ces colonnes contiennent une version conforme à la norme AFNOR NF Z10-011 correspondant aux lignes 4 et 5 du libellé d'adresse trouvé par le géocodage.
Ce traitement ne remplace toutefois pas un véritable traitement RNVP, car il n'effectue aucune validation dans les bases postales.

Dernière modification par cquest (Thu 21 June 2018 09:26)


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#19 Thu 21 June 2018 16:07

Robin
GeoRezo forever
Lieu: France
Date d'inscription: 31 Aug 2005
Messages: 13614
Site web

Re: SIRENE géocodée... infos et discussions

Pour ceux qui se demandent : "Un traitement RNVP (Restructuration, Normalisation, Validation Postale) est une suite d’opérations effectuée sur un fichier qui permet de s’assurer de l’existence des adresses présentes dans un fichier et de leur caractère normalisé."

Hors ligne

 

#20 Thu 21 June 2018 19:44

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Oups, effectivement, j'ai pas précisé !

C'est nécessaire essentiellement pour l'envoi en masse de courriers, afin de bénéficier des meilleurs tarifs. Sinon... pas vraiment indispensable wink


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#21 Fri 12 October 2018 19:01

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

L'INSEE modifie le format de diffusion des données de la base SIRENE... et les premiers fichiers "stock" au nouveau format sont disponibles sur:

https://www.data.gouv.fr/fr/datasets/5b … 9d30727e0/

J'ai mis à jour mes scripts de géocodage et géocodé ces nouveaux fichiers qui sont disponibles sur http://data.cquest.org/geo_sirene/v2019/

Quoi de neuf ?

Seul le fichier StockEtablissement est traité, vu que c'est le seul fichier parmis les 4 diffusés par l'INSEE qui contient des adresses.

Les changements:
- les fichiers départementaux sont désormais compressés en gzip (plus de 7z)
- le stock national est disponible pour les établissements Actifs et pour l'ensemble des établissements (Actifs ou Fermés)
- un traitement supplémentaire prends en compte les anciennes communes qui n'existent plus (fusions) et leur fait correspondre le code INSEE actuel afin de permettre le géocodage. Certaines "adresses" ne sont plus géocodables (ex: "GALERIE MARCHANDE MAMMOUTH")

Fichiers générés

- StockEtablissement_geo.csv.gz : fichier national complet (29 millions)
- StockEtablissementActif_geo.csv.gz : fichier national des établissements Actifs (11 millions)
- geo_siret_DDD.csv.gz : stock complet pour un département (et découpé par arrondissements de Paris)
- communes/{codeINSEEcommune}.csv : stock complet pour une commune
- logs.tgz : logs complet de géocodage (un fichier par département)
- stats.json : statistiques finales du géocodage par département

N'hésitez pas à me signaler toute anomalie, ça sent encore un peu la peinture fraîche même si la partie géocodage est très proche de ce qui a été fait jusqu'à maintenant.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#22 Fri 19 October 2018 09:33

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

J'ai refait une passe de géocodage sur ces nouveaux fichiers... car le géocodage avec BANO n'était pas pris en compte.
Il permet de gagner 1% environ d'adresses supplémentaires géocodées.

http://data.cquest.org/geo_sirene/v2019/last en cours d'upload


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#23 Fri 02 November 2018 07:36

grunt
Participant actif
Date d'inscription: 9 Nov 2010
Messages: 90

Re: SIRENE géocodée... infos et discussions

Je dois observer ici une minute de grommellements

Je suis passé hier sur le site de téléchargement des données SIRENE, car je m'occupe aussi d'en analyser un et mes préparations durent pour cela depuis quelques temps.

J'y trouve des fichiers de nouvelle forme, différents de celui – mastoc – que je téléchargeais jusque-là, et qui est rangé ici désormais, avec l'indication qu'il cessera d'être mis à jour sous cette forme au 31 Janvier 2019 : dans trois mois. Çaaaaaaaaargh, me laisse le temps ?!

Je ne suis pas contre qu'ils divisent les nouveaux fichiers en deux unités distinctes : établissements d'un côté, entreprises de l'autre. Mais bon, les formats ne sont plus les mêmes, il va falloir s'adapter.


EDIT : Houlà... il les ont bien réduit en contenu, quand même.

Description d'une entreprise :

Code:

Nom    Libellé    Longueur    Type    Ordre
siren    Numéro Siren    9    Texte    1
statutDiffusionUniteLegale    Statut de diffusion de l’unité légale    1    Liste de codes    2
unitePurgeeUniteLegale    Unité légale purgée    5    Texte    3
dateCreationUniteLegale    Date de création de l'unité légale    10    Date    4
sigleUniteLegale    Sigle de l’unité légale    20    Texte    5
sexeUniteLegale    Caractère féminin ou masculin de la personne physique    1    Liste de codes    6
prenom1UniteLegale    Premier prénom déclaré pour un personne physique    20    Texte    7
prenom2UniteLegale    Deuxième prénom déclaré pour un personne physique    20    Texte    8
prenom3UniteLegale    Troisième prénom déclaré pour un personne physique    20    Texte    9
prenom4UniteLegale    Quatrième prénom déclaré pour un personne physique    20    Texte    10
prenomUsuelUniteLegale    Prénom usuel de la personne physique    20    Texte    11
pseudonymeUniteLegale    Pseudonyme de la personne physique    100    Texte    12
identifiantAssociationUniteLegale    Numéro au Répertoire National des Associations    10    Texte    13
trancheEffectifsUniteLegale    Tranche d’effectif salarié de l’unité légale    2    Liste de codes    14
anneeEffectifsUniteLegale    Année de validité de la tranche d’effectif salarié de l’unité légale    4    Date    15
dateDernierTraitementUniteLegale    Date du dernier traitement de l’unité légale dans le répertoire Sirene    10    Date    16
nombrePeriodesUniteLegale    Nombre de périodes de l’unité légale    2    Numérique    17
categorieEntreprise    Catégorie à laquelle appartient l’entreprise    3    Liste de codes    18
anneeCategorieEntreprise    Année de validité de la catégorie d’entreprise    4    Date    19
dateDebut    Date de début d'une période d'historique d'une unité légale    10    Date    20
etatAdministratifUniteLegale    État administratif de l’unité légale    1    Liste de codes    21
nomUniteLegale    Nom de naissance de la personnes physique    100    Texte    22
nomUsageUniteLegale    Nom d’usage de la personne physique    100    Texte    23
denominationUniteLegale    Dénomination de l’unité légale    120    Texte    24
denominationUsuelle1UniteLegale    Dénomination usuelle de l’unité légale    70    Texte    25
denominationUsuelle2UniteLegale    Dénomination usuelle de l’unité légale – deuxième champ    70    Texte    26
denominationUsuelle3UniteLegale    Dénomination usuelle de l’unité légale – troisième champ    70    Texte    27
categorieJuridiqueUniteLegale    Catégorie juridique de l’unité légale    4    Liste de codes    28
activitePrincipaleUniteLegale    Activité principale de l’unité légale    6    Liste de codes    29
nomenclatureActivitePrincipaleUniteLegale    Nomenclature d’activité de la variable activitePrincipaleUniteLegale    8    Liste de codes    30
nicSiegeUniteLegale    Numéro interne de classement (Nic) de l’unité légale    5    Texte    31
economieSocialeSolidaireUniteLegale    Appartenance au champ de l’économie sociale et solidaire    1    Liste de codes    32
caractereEmployeurUniteLegale    Caractère employeur de l’unité légale    1    Liste de codes    33

Description d'un établissement :

Code:

Nom    Libellé    Longueur    Type    Ordre
siren    Numéro Siren    9    Texte    1
nic    Numéro interne de classement de l'établissement    5    Texte    2
siret    Numéro Siret    14    Texte    3
statutDiffusionEtablissement    Statut de diffusion de l’établissement    1    Liste de codes    4
dateCreationEtablissement    Date de création de l’établissement    10    Date    5
trancheEffectifsEtablissement    Tranche d’effectif salarié de l’établissement    2    Liste de codes    6
anneeEffectifsEtablissement    Année de validité de la tranche d’effectif salarié de l’établissement    4    Date    7
activitePrincipaleRegistreMetiersEtablissement    Activité exercée par l’artisan inscrit au registre des métiers    6    Liste de codes    8
dateDernierTraitementEtablissement    Date du dernier traitement de l’établissement dans le répertoire Sirene    10    Date    9
etablissementSiege    Qualité de siège ou non de l’établissement    5    Texte    10
nombrePeriodesEtablissement    Nombre de périodes de l’établissement    2    Numérique    11
complementAdresseEtablissement    Complément d’adresse    38    Texte    12
numeroVoieEtablissement    Numéro de voie    4    Numérique    13
indiceRepetitionEtablissement    Indice de répétition dans la voie    1    Texte    14
typeVoieEtablissement    Type de voie    4    Liste de codes    15
libelleVoieEtablissement    Libellé de voie    100    Texte    16
codePostalEtablissement    Code postal    5    Texte    17
libelleCommuneEtablissement    Libellé de la commune    100    Texte    18
libelleCommuneEtrangerEtablissement    Libellé de la commune pour un établissement situé à l’étranger    100    Texte    19
distributionSpecialeEtablissement    Distribution spéciale de l’établissement    26    Texte    20
codeCommuneEtablissement    Code commune de l’établissement    5    Liste de codes    21
codeCedexEtablissement    Code cedex    9    Texte    22
libelleCedexEtablissement    Libellé du code cedex    100    Texte    23
codePaysEtrangerEtablissement    Code pays pour un établissement situé à l’étranger    5    Liste de codes    24
libellePaysEtrangerEtablissement    Libellé du pays pour un établissement situé à l’étranger    100    Texte    25
complementAdresse2Etablissement    Complément d’adresse secondaire    38    Texte    26
numeroVoie2Etablissement    Numéro de la voie de l’adresse secondaire    4    Numérique    27
indiceRepetition2Etablissement    Indice de répétition dans la voie pour l’adresse secondaire    1    Texte    28
typeVoie2Etablissement    Type de voie de l’adresse secondaire    4    Liste de codes    29
libelleVoie2Etablissement    Libellé de voie de l’adresse secondaire    100    Texte    30
codePostal2Etablissement    Code postal de l’adresse secondaire    5    Texte    31
libelleCommune2Etablissement    Libellé de la commune de l’adresse secondaire    100    Texte    32
libelleCommuneEtranger2Etablissement    Libellé de la commune de l’adresse secondaire pour un établissement situé à l’étranger    100    Texte    33
distributionSpeciale2Etablissement    Distribution spéciale de l’adresse secondaire de l’établissement    26    Texte    34
codeCommune2Etablissement    Code commune de l’adresse secondaire    5    Liste de codes    35
codeCedex2Etablissement    Code cedex de l’adresse secondaire    9    Texte    36
libelleCedex2Etablissement    Libellé du code cedex de l’adresse secondaire    100    Texte    37
codePaysEtranger2Etablissement    Code pays de l’adresse secondaire pour un établissement situé à l’étranger    5    Liste de codes    38
libellePaysEtranger2Etablissement    Libellé du pays de l’adresse secondaire pour un établissement situé à l’étranger    100    Texte    39
dateDebut    Date de début d'une période d'historique d'un établissement    10    Date    40
etatAdministratifEtablissement    État administratif de l’établissement    1    Liste de codes    41
enseigne1Etablissement    Première ligne d’enseigne de l’établissement    50    Texte    42
enseigne2Etablissement    Deuxième ligne d’enseigne de l’établissement    50    Texte    43
enseigne3Etablissement    Troisième ligne d’enseigne de l’établissement    50    Texte    44
denominationUsuelleEtablissement    Dénomination usuelle de l’établissement    100    Texte    45
activitePrincipaleEtablissement    Activité principale de l'établissement pendant la période    6    Liste de codes    46
nomenclatureActivitePrincipaleEtablissement    Nomenclature d’activité de la variable activitePrincipaleEtablissement    8    Liste de codes    47
caractereEmployeurEtablissement    Caractère employeur de l’établissement    1    Liste de codes    48

On va à l'essentiel, j'en conviens, mais plus d'effectif à la centaine près, plus de taille de l'unité urbaine, plus d'activités secondaires, plus de libellés d'accompagnement, EPCI : c'est fini...
Je dirais, si je voulais profiter de mon anonymat sur Internet et accuser sans preuves, que ça sentirait le mouvement d'humeur...

Bon, ben... c'est comme ça, c'est comme ça. Pour retrouver les anciens trucs, va falloir tout jointurer.

Dernière modification par grunt (Fri 02 November 2018 17:06)

Hors ligne

 

#24 Tue 06 November 2018 23:00

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

grunt a écrit:

Bon, ben... c'est comme ça, c'est comme ça. Pour retrouver les anciens trucs, va falloir tout jointurer.


J'essaye de re-générer des fichiers CSV les plus proches possibles des CSV version 2017.
C'est ici: http://data.cquest.org/geo_sirene/beta/ … ifs.csv.gz

Beaucoup de jointures, et bien sûr, impossible de reconstituer des données totalement manquantes comme l'effectif à la centaine près, ou alors il va falloir utiliser d'autres sources.

Autre recul, les CSV version 2019 ne sont disponibles qu'en stocks mensuels, plus de CSV de mise à jour quotidiens.
J'ai là aussi tenté de les générer à partir de l'APIv3 de l'INSEE pour SIRENE et le résultat est là: http://data.cquest.org/geo_sirene/v2019/quotidien/

Bref, l'idée est est d'avoir un plan B pour une transition douce si jamais on ne peut pas s'adapter d'ici fin janvier 2019, car tout le monde ne peut pas modifier son SI en trois mois.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#25 Mon 12 November 2018 11:30

grunt
Participant actif
Date d'inscription: 9 Nov 2010
Messages: 90

Re: SIRENE géocodée... infos et discussions

Où es-tu parvenu à retrouver chez l'INSEE ou sur data.gouv.fr les données qui ont été supprimées des nouveaux fichiers StockUniteLegale et StockEtablissement ? Car certaines d'entre-elles, je les trouvais bien.

Hors ligne

 

#26 Wed 14 November 2018 12:28

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

grunt a écrit:

Où es-tu parvenu à retrouver chez l'INSEE ou sur data.gouv.fr les données qui ont été supprimées des nouveaux fichiers StockUniteLegale et StockEtablissement ? Car certaines d'entre-elles, je les trouvais bien.


Elles sont regénérées par croisement avec le COG et différentes nomenclatures.
C'est peut être pas parfait, donc les retours sont les bienvenus (même les négatifs, et ouais).


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#27 Fri 23 November 2018 14:25

grunt
Participant actif
Date d'inscription: 9 Nov 2010
Messages: 90

Re: SIRENE géocodée... infos et discussions

Une liste de correspondance SIRENE 2018 - 2019 a été publiée, elle facilitera la migration.
https://github.com/ColinMaudry/sirene-l … vs2019.csv


Je viens de finir la mienne, mais j'ai encore des bizarreries.
Particulièrement, des entreprises mono-établissement qui sont actives mais leur établissement, unique donc, lui est fermé.
Et alors, je ne sais pas quoi en conclure.

Hors ligne

 

#28 Fri 23 November 2018 17:41

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

grunt a écrit:

Une liste de correspondance SIRENE 2018 - 2019 a été publiée, elle facilitera la migration.
https://github.com/ColinMaudry/sirene-l … vs2019.csv


Je viens de finir la mienne, mais j'ai encore des bizarreries.
Particulièrement, des entreprises mono-établissement qui sont actives mais leur établissement, unique donc, lui est fermé.
Et alors, je ne sais pas quoi en conclure.


Il y a aussi des incohérences entre stock v2017 et v2019 à une même date. sad


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#29 Sun 13 January 2019 12:38

grunt
Participant actif
Date d'inscription: 9 Nov 2010
Messages: 90

Re: SIRENE géocodée... infos et discussions

Ouf, ça y est.
Moi aussi je suis parvenu à exploiter ce diable de nouveau fichier SIRENE.

J'ai produit une carte des activités principales des entreprises basées dans les communes à partir de leur code APE.
Sur la carte en pièce jointe, apparaissent les trois premières sections NAF (le premier niveau des codes NAF) des activités qui ont le plus grand nombre de salariés, d'après des données de Septembre 2018.

A : Agriculture, sylviculture et pêche
B : Industries extractives
C : Industrie manufacturière
D : Production et distribution d'électricité, de gaz, de vapeur et d'air conditionné
E : Production et distribution d'eau ; assainissement, gestion des déchets et dépollution
F : Construction
G : Commerce ; réparation d'automobiles et de motocycles
H : Transports et entreposage
I : Hébergement et restauration
J : Information et communication
K : Activités financières et d'assurance
L : Activités immobilières
M : Activités spécialisées, scientifiques et techniques
N : Activités de services administratifs et de soutien
O : Administration publique
P : Enseignement
Q : Santé humaine et action sociale
R : Arts, spectacles et activités récréatives
S : Autres activités de services
T : Activités des ménages en tant qu'employeurs ; activités indifférenciées des ménages en tant que producteurs de biens et services pour usage propre
U : Activités extra-territoriales

Exemple : Douarnenez :
première activité : C : Industrie manufacturière, avec 1 626 salariés,
puis Q : Santé humaine et action sociale avec 1 605 salariés
puis G : Commerce ; réparation d'automobiles et de motocycles avec 978 salariés.

La première exécution avait duré quatre jours... Il a fallu batailler pour réduire ça à 20 minutes.

Dernière modification par grunt (Sun 13 January 2019 12:59)


Fichier(s) joint(s) :
Pour accéder aux fichiers vous devez vous inscrire.

Hors ligne

 

#30 Fri 17 May 2019 10:45

yartostout
Participant assidu
Lieu: Bretagne
Date d'inscription: 24 Jun 2015
Messages: 173

Re: SIRENE géocodée... infos et discussions

@ Christian ou autres personne qui le sait ;-)

En ce qui concerne le geo_sirene_2017 téléchargeable sur le serveur de Christian, savez-vous s'il s'agit des établissements actifs seulement ?
Ou de l'ensemble des actifs et fermés ?

Je ne retrouve pas la variable les différenciant dans le fichier de correspondance du github...!

Merci à vous !

Hors ligne

 

Pied de page des forums

Powered by FluxBB