- Sujet précédent - SIRENE géocodée... infos et discussions - Sujet suivant
#1 Thu 26 October 2017 21:13
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
SIRENE géocodée... infos et discussions
J'ouvre un fil de discussion dédiée à la version géocodée de SIRENE avec quelques infos fraîches.
Jusqu'à maintenant, ce géocodage s'appuyait sur les bases BAN et BANO et je suis en train de finaliser l'ajout d'une troisième source: les POI d'OpenStreetMap.
Pourquoi ?
Dans la liste des adresses ne pouvant être géocodées, un bon nombre correspond à un point d'intérêt et pas à une adresse.
Quelques exemples:
- MAIRIE, LA MAIRIE, HOTEL DE VILLE
- PALAIS DE JUSTICE, GARE, LA GARE
- CENTRE COMMERCIAL MACHINCHOSE
- AEROPORT DE TATAOUINE
- CHATEAU DE BIDULLE, FORT DE TRUC
etc...
Depuis déjà un certain temps, j'ai monté une instance d'addok avec comme référentiel les POI extraits d'OpenStreetMap et reformatés pour être injectés dans le géocodeur addok. Les scripts qui préparent les données sont sur https://github.com/osm-fr/osmpoi4addok
Pour les adresses non trouvées dans BAN et BANO, j'ajoute donc une étape en plus, très efficace pour les mairies et les centres commerciaux où beaucoup d'établissements sont localisés.
Le 'type' commence dans ce cas par 'poi', exemple: poi.townhall pour une mairie, poi.mall pour un centre commercial, etc
L'id est le lien vers l'objet OpenStreetMap, exemple: http://osm.org/way/113312454
Pour résumer, voici les colonnes ajoutées par le géocodage:
- longitude: longitude de l'adresse trouvée (en degrés décimaux WGS84)
- latitude: latitude de l'adresse trouvée (en degrés décimaux WGS84)
- geo_score: score de 0 à 1 de confiance du géocodage (plus il est élevé plus on a de chance d'avoir trouvé ladresse)
- geo_type: type d'adresse trouvée housenumber= au numéro, street= à la rue, locality= au lieu-dit, municipality = à la commune, poi= point d'intérêt
- geo_adresse: version textuelle de l'adresse trouvée, ex: 20 avenue de Ségur 75007 Paris
- geo_id: identifiant de cette adresse dans la base source où elle a été trouvée
- geo_ligne: quelle ligne d'adresse de la base SIRENE a pu être géocodée (G=géographique, D=déclarée, N = normalisée)
- geo_l4: ligne 4 à la norme AFNOR adresse
- geo_l5: ligne 5 à la norme AFNOR adresse
Dernière modification par cquest (Fri 04 January 2019 12:58)
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#3 Fri 27 October 2017 09:45
- Raphaël_
- Participant actif
- Date d'inscription: 18 Jan 2016
- Messages: 110
Re: SIRENE géocodée... infos et discussions
Merci bien !
Hors ligne
#4 Thu 02 November 2017 14:46
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Avis à la population !
Le stock SIRENE à fin octobre géocodé est dispo: http://data.cquest.org/geo_sirene/last/
Bases utilisées:
- BAN du 30/10/2017
- BANO du 01/11/2017
- POI OSM du 26/10/2017
Un peu de lecture sur les nouveautés est disponible sur: https://medium.com/@cq94/g%C3%A9ocodage … 0e14e87a8d
Dernière modification par cquest (Wed 07 March 2018 18:48)
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#5 Sat 06 January 2018 15:32
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
La version géocodée de SIRENE au 1/1/2018 est disponible...
http://data.cquest.org/geo_sirene/2017-12/
Dernière modification par cquest (Wed 07 March 2018 18:49)
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#6 Tue 09 January 2018 15:10
- Theos2000
- Participant assidu
- Date d'inscription: 15 Jun 2015
- Messages: 221
Re: SIRENE géocodée... infos et discussions
(Risque de Hors sujet)
Travail titanesque mais o combien utile. Merci beaucoup...
A quand l'intégration des données Sirène dans OpenstreetMap ???
Car il semble que Google l'ai déjà fait sur certains territoires ...
Hors ligne
#7 Tue 09 January 2018 15:37
Re: SIRENE géocodée... infos et discussions
Une partie seulement peut-être car ça ne décrit pas le territoire, contrairement aux commerces visibles avec enseigne.
Hors ligne
#8 Tue 09 January 2018 17:50
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Il y a quelques tests qui ont été fait sur les pharmacies (un de mes TOC).
Le besoin de contrôle est réel car des établissements ne sont pas à l'adresse déclarée, ils peuvent aussi ne plus être en activité (en cours de liquidation).
SIRENE permet par contre de détecter plus rapidement des changements car un nouveau commerce figure dans SIRENE en général avant même d'ouvrir.
Autre usage de SIRENE... un géocodeur de POI. J'ai chargé une instance d'addok (le géocodeur d'Etalab derrière adresse.data.gouv.fr) avec les commerces de SIRENE, accessible pour test sur http://sirene.addok.xyz/
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#9 Tue 20 February 2018 17:51
Re: SIRENE géocodée... infos et discussions
La charge de travail doit vraiment être colossale, tout autant que l'intérêt du travail en lui-même.
Merci beaucoup à vous de contribuer (aussi fortement) à cette démarche de partage et de démocratisation des données.
Hors ligne
#10 Wed 28 February 2018 21:46
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Pour les utilisateurs de la base SIRENE, je viens d'ajouter sur data.gouv.fr un petit retraitement des fichiers de mise à jour quotidien: la liste des changements de codes SIRET.
C'est par exemple le cas lorsqu'une entreprise déménage... donc plutôt utile.
Les scripts de traitement sont sur: https://github.com/cquest/histo_sirene
Les données extraites par ces scripts sont téléchargeables sur http://data.cquest.org/histo_sirene/
Ce sont des fichiers CSV très simples:
- ancien code SIRET
- nouveau code SIRET
- date du changement
Il y a un fichier pour chaque mise à jour quotidienne de SIRENE et un fichier de cumul annuel et si j'ai tout bien configuré ça devrait se mettre à jour tout seul vers 10h du matin... à vérifier demain
L'historique démarre en janvier 2017, date depuis laquelle la base SIRENE et ses mises à jour sont en opendata.
Dernière modification par cquest (Wed 07 March 2018 18:49)
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#11 Wed 28 February 2018 23:01
Re: SIRENE géocodée... infos et discussions
Christian,
Existe-t-il un espoir que Pôle emploi s'appuie sur ce travail pour localiser les offres d'emplois dans une carto dynamique ouverte (pour le grand public)?
Peut-être cela existe-t-il déjà...
Bruno
Hors ligne
#12 Wed 28 February 2018 23:08
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Aucune idée, par contre, il y a des usages dans le domaine de l'emploi tel que https://labonneboite.pole-emploi.fr/ où la géoloc est utilisée.
La Bonne Boite effectue un ciblage spécifique des entreprises à fort potentiel d’embauche afin de faire gagner du temps dans la sélection des entreprises à démarcher.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#13 Thu 01 March 2018 21:33
Re: SIRENE géocodée... infos et discussions
Merci, c'est malin.
J'imagine que les contrats en alternance ne sont pas comptés dans les ETP de la fonction publique...
Hors ligne
#14 Wed 04 April 2018 15:48
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Géocodage mensuel de SIRENE fait... et j'en profite pour signaler un changement d'adresse.
Une URL stable (data.cquest.org) remplace désormais l'IPv4 qui était utilisée et donc cela donne: http://data.cquest.org/geo_sirene/
Vous trouverez pas mal d'autres données utiles sur ce serveur.
J'ai par exemple ajouté le fameux carroyage à 200m de l'INSEE sous forme de shapefile prêts à l'emploi, plus pratiques que les données MIF/MID+DBF publiées par l'INSEE: http://data.cquest.org/insee_carroyage/
Le but est aussi de conserver des archives là où c'est pertinent.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#15 Fri 06 April 2018 12:53
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Retour sur la base SIRENE géocodée...
J'ai ajouté le géocodage des fichiers de mise à jour (quasi quotidiens).
Ils sont ici: http://data.cquest.org/geo_sirene/quotidien/
Le géocodage des anciens fichiers est en cours, la liste va donc petit à petit s'allonger en remontant dans le passé...
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#16 Fri 27 April 2018 18:02
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Petit changement à prévoir dans le fichier "stock" géocodé en début de mois...
J'avais éliminé certaines colonnes redondantes (les libellés des catégories, les liens entre commune, département, région, EPCI).
J'ai tout remis pour être cohérent avec les fichiers quotidiens et rester au plus proche des fichiers d'origine, même si ça gonfle un peu au final la taille des fichiers.
Si vous voulez voir ce que ça donne, c'est sur: http://data.cquest.org/temp/
A partir du prochain stock, ça sera publié à l'emplacement habituel.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#17 Wed 02 May 2018 09:48
- Jean-Michel
- Membre
- Lieu: An Oriant /Lorient
- Date d'inscription: 3 Oct 2005
- Messages: 3909
Re: SIRENE géocodée... infos et discussions
Bonjour et Merci Christian,
Voir également cette initiative : https://github.com/ColinMaudry/sirene-ld
(Transformation du répertoire SIRENE (CSV) au format RDF pour publication en Linked Data )
Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !
Hors ligne
#18 Thu 21 June 2018 08:21
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Petit changement à partir d'aujourdhui...
Depuis le 21 juin 2018, l'INSEE n'effectuant plus de traitement RNVP sur la base SIRENE, deux colonnes (geo_l4 et geo_l5) issues du géocodage ont été ajoutées pour partiellement pallier ce changement.
Ces colonnes contiennent une version conforme à la norme AFNOR NF Z10-011 correspondant aux lignes 4 et 5 du libellé d'adresse trouvé par le géocodage.
Ce traitement ne remplace toutefois pas un véritable traitement RNVP, car il n'effectue aucune validation dans les bases postales.
Dernière modification par cquest (Thu 21 June 2018 09:26)
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#19 Thu 21 June 2018 16:07
Re: SIRENE géocodée... infos et discussions
Pour ceux qui se demandent : "Un traitement RNVP (Restructuration, Normalisation, Validation Postale) est une suite d’opérations effectuée sur un fichier qui permet de s’assurer de l’existence des adresses présentes dans un fichier et de leur caractère normalisé."
Hors ligne
#20 Thu 21 June 2018 19:44
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Oups, effectivement, j'ai pas précisé !
C'est nécessaire essentiellement pour l'envoi en masse de courriers, afin de bénéficier des meilleurs tarifs. Sinon... pas vraiment indispensable
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#21 Fri 12 October 2018 19:01
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
L'INSEE modifie le format de diffusion des données de la base SIRENE... et les premiers fichiers "stock" au nouveau format sont disponibles sur:
https://www.data.gouv.fr/fr/datasets/5b … 9d30727e0/
J'ai mis à jour mes scripts de géocodage et géocodé ces nouveaux fichiers qui sont disponibles sur http://data.cquest.org/geo_sirene/v2019/
Quoi de neuf ?
Seul le fichier StockEtablissement est traité, vu que c'est le seul fichier parmis les 4 diffusés par l'INSEE qui contient des adresses.
Les changements:
- les fichiers départementaux sont désormais compressés en gzip (plus de 7z)
- le stock national est disponible pour les établissements Actifs et pour l'ensemble des établissements (Actifs ou Fermés)
- un traitement supplémentaire prends en compte les anciennes communes qui n'existent plus (fusions) et leur fait correspondre le code INSEE actuel afin de permettre le géocodage. Certaines "adresses" ne sont plus géocodables (ex: "GALERIE MARCHANDE MAMMOUTH")
Fichiers générés
- StockEtablissement_geo.csv.gz : fichier national complet (29 millions)
- StockEtablissementActif_geo.csv.gz : fichier national des établissements Actifs (11 millions)
- geo_siret_DDD.csv.gz : stock complet pour un département (et découpé par arrondissements de Paris)
- communes/{codeINSEEcommune}.csv : stock complet pour une commune
- logs.tgz : logs complet de géocodage (un fichier par département)
- stats.json : statistiques finales du géocodage par département
N'hésitez pas à me signaler toute anomalie, ça sent encore un peu la peinture fraîche même si la partie géocodage est très proche de ce qui a été fait jusqu'à maintenant.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#22 Fri 19 October 2018 09:33
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
J'ai refait une passe de géocodage sur ces nouveaux fichiers... car le géocodage avec BANO n'était pas pris en compte.
Il permet de gagner 1% environ d'adresses supplémentaires géocodées.
http://data.cquest.org/geo_sirene/v2019/last en cours d'upload
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#23 Fri 02 November 2018 07:36
- grunt
- Participant actif
- Date d'inscription: 9 Nov 2010
- Messages: 90
Re: SIRENE géocodée... infos et discussions
Je dois observer ici une minute de grommellements
Je suis passé hier sur le site de téléchargement des données SIRENE, car je m'occupe aussi d'en analyser un et mes préparations durent pour cela depuis quelques temps.
J'y trouve des fichiers de nouvelle forme, différents de celui – mastoc – que je téléchargeais jusque-là, et qui est rangé ici désormais, avec l'indication qu'il cessera d'être mis à jour sous cette forme au 31 Janvier 2019 : dans trois mois. Çaaaaaaaaargh, me laisse le temps ?!
Je ne suis pas contre qu'ils divisent les nouveaux fichiers en deux unités distinctes : établissements d'un côté, entreprises de l'autre. Mais bon, les formats ne sont plus les mêmes, il va falloir s'adapter.
EDIT : Houlà... il les ont bien réduit en contenu, quand même.
Description d'une entreprise :
Code:
Nom Libellé Longueur Type Ordre siren Numéro Siren 9 Texte 1 statutDiffusionUniteLegale Statut de diffusion de l’unité légale 1 Liste de codes 2 unitePurgeeUniteLegale Unité légale purgée 5 Texte 3 dateCreationUniteLegale Date de création de l'unité légale 10 Date 4 sigleUniteLegale Sigle de l’unité légale 20 Texte 5 sexeUniteLegale Caractère féminin ou masculin de la personne physique 1 Liste de codes 6 prenom1UniteLegale Premier prénom déclaré pour un personne physique 20 Texte 7 prenom2UniteLegale Deuxième prénom déclaré pour un personne physique 20 Texte 8 prenom3UniteLegale Troisième prénom déclaré pour un personne physique 20 Texte 9 prenom4UniteLegale Quatrième prénom déclaré pour un personne physique 20 Texte 10 prenomUsuelUniteLegale Prénom usuel de la personne physique 20 Texte 11 pseudonymeUniteLegale Pseudonyme de la personne physique 100 Texte 12 identifiantAssociationUniteLegale Numéro au Répertoire National des Associations 10 Texte 13 trancheEffectifsUniteLegale Tranche d’effectif salarié de l’unité légale 2 Liste de codes 14 anneeEffectifsUniteLegale Année de validité de la tranche d’effectif salarié de l’unité légale 4 Date 15 dateDernierTraitementUniteLegale Date du dernier traitement de l’unité légale dans le répertoire Sirene 10 Date 16 nombrePeriodesUniteLegale Nombre de périodes de l’unité légale 2 Numérique 17 categorieEntreprise Catégorie à laquelle appartient l’entreprise 3 Liste de codes 18 anneeCategorieEntreprise Année de validité de la catégorie d’entreprise 4 Date 19 dateDebut Date de début d'une période d'historique d'une unité légale 10 Date 20 etatAdministratifUniteLegale État administratif de l’unité légale 1 Liste de codes 21 nomUniteLegale Nom de naissance de la personnes physique 100 Texte 22 nomUsageUniteLegale Nom d’usage de la personne physique 100 Texte 23 denominationUniteLegale Dénomination de l’unité légale 120 Texte 24 denominationUsuelle1UniteLegale Dénomination usuelle de l’unité légale 70 Texte 25 denominationUsuelle2UniteLegale Dénomination usuelle de l’unité légale – deuxième champ 70 Texte 26 denominationUsuelle3UniteLegale Dénomination usuelle de l’unité légale – troisième champ 70 Texte 27 categorieJuridiqueUniteLegale Catégorie juridique de l’unité légale 4 Liste de codes 28 activitePrincipaleUniteLegale Activité principale de l’unité légale 6 Liste de codes 29 nomenclatureActivitePrincipaleUniteLegale Nomenclature d’activité de la variable activitePrincipaleUniteLegale 8 Liste de codes 30 nicSiegeUniteLegale Numéro interne de classement (Nic) de l’unité légale 5 Texte 31 economieSocialeSolidaireUniteLegale Appartenance au champ de l’économie sociale et solidaire 1 Liste de codes 32 caractereEmployeurUniteLegale Caractère employeur de l’unité légale 1 Liste de codes 33
Description d'un établissement :
Code:
Nom Libellé Longueur Type Ordre siren Numéro Siren 9 Texte 1 nic Numéro interne de classement de l'établissement 5 Texte 2 siret Numéro Siret 14 Texte 3 statutDiffusionEtablissement Statut de diffusion de l’établissement 1 Liste de codes 4 dateCreationEtablissement Date de création de l’établissement 10 Date 5 trancheEffectifsEtablissement Tranche d’effectif salarié de l’établissement 2 Liste de codes 6 anneeEffectifsEtablissement Année de validité de la tranche d’effectif salarié de l’établissement 4 Date 7 activitePrincipaleRegistreMetiersEtablissement Activité exercée par l’artisan inscrit au registre des métiers 6 Liste de codes 8 dateDernierTraitementEtablissement Date du dernier traitement de l’établissement dans le répertoire Sirene 10 Date 9 etablissementSiege Qualité de siège ou non de l’établissement 5 Texte 10 nombrePeriodesEtablissement Nombre de périodes de l’établissement 2 Numérique 11 complementAdresseEtablissement Complément d’adresse 38 Texte 12 numeroVoieEtablissement Numéro de voie 4 Numérique 13 indiceRepetitionEtablissement Indice de répétition dans la voie 1 Texte 14 typeVoieEtablissement Type de voie 4 Liste de codes 15 libelleVoieEtablissement Libellé de voie 100 Texte 16 codePostalEtablissement Code postal 5 Texte 17 libelleCommuneEtablissement Libellé de la commune 100 Texte 18 libelleCommuneEtrangerEtablissement Libellé de la commune pour un établissement situé à l’étranger 100 Texte 19 distributionSpecialeEtablissement Distribution spéciale de l’établissement 26 Texte 20 codeCommuneEtablissement Code commune de l’établissement 5 Liste de codes 21 codeCedexEtablissement Code cedex 9 Texte 22 libelleCedexEtablissement Libellé du code cedex 100 Texte 23 codePaysEtrangerEtablissement Code pays pour un établissement situé à l’étranger 5 Liste de codes 24 libellePaysEtrangerEtablissement Libellé du pays pour un établissement situé à l’étranger 100 Texte 25 complementAdresse2Etablissement Complément d’adresse secondaire 38 Texte 26 numeroVoie2Etablissement Numéro de la voie de l’adresse secondaire 4 Numérique 27 indiceRepetition2Etablissement Indice de répétition dans la voie pour l’adresse secondaire 1 Texte 28 typeVoie2Etablissement Type de voie de l’adresse secondaire 4 Liste de codes 29 libelleVoie2Etablissement Libellé de voie de l’adresse secondaire 100 Texte 30 codePostal2Etablissement Code postal de l’adresse secondaire 5 Texte 31 libelleCommune2Etablissement Libellé de la commune de l’adresse secondaire 100 Texte 32 libelleCommuneEtranger2Etablissement Libellé de la commune de l’adresse secondaire pour un établissement situé à l’étranger 100 Texte 33 distributionSpeciale2Etablissement Distribution spéciale de l’adresse secondaire de l’établissement 26 Texte 34 codeCommune2Etablissement Code commune de l’adresse secondaire 5 Liste de codes 35 codeCedex2Etablissement Code cedex de l’adresse secondaire 9 Texte 36 libelleCedex2Etablissement Libellé du code cedex de l’adresse secondaire 100 Texte 37 codePaysEtranger2Etablissement Code pays de l’adresse secondaire pour un établissement situé à l’étranger 5 Liste de codes 38 libellePaysEtranger2Etablissement Libellé du pays de l’adresse secondaire pour un établissement situé à l’étranger 100 Texte 39 dateDebut Date de début d'une période d'historique d'un établissement 10 Date 40 etatAdministratifEtablissement État administratif de l’établissement 1 Liste de codes 41 enseigne1Etablissement Première ligne d’enseigne de l’établissement 50 Texte 42 enseigne2Etablissement Deuxième ligne d’enseigne de l’établissement 50 Texte 43 enseigne3Etablissement Troisième ligne d’enseigne de l’établissement 50 Texte 44 denominationUsuelleEtablissement Dénomination usuelle de l’établissement 100 Texte 45 activitePrincipaleEtablissement Activité principale de l'établissement pendant la période 6 Liste de codes 46 nomenclatureActivitePrincipaleEtablissement Nomenclature d’activité de la variable activitePrincipaleEtablissement 8 Liste de codes 47 caractereEmployeurEtablissement Caractère employeur de l’établissement 1 Liste de codes 48
On va à l'essentiel, j'en conviens, mais plus d'effectif à la centaine près, plus de taille de l'unité urbaine, plus d'activités secondaires, plus de libellés d'accompagnement, EPCI : c'est fini...
Je dirais, si je voulais profiter de mon anonymat sur Internet et accuser sans preuves, que ça sentirait le mouvement d'humeur...
Bon, ben... c'est comme ça, c'est comme ça. Pour retrouver les anciens trucs, va falloir tout jointurer.
Dernière modification par grunt (Fri 02 November 2018 17:06)
Hors ligne
#24 Tue 06 November 2018 23:00
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Bon, ben... c'est comme ça, c'est comme ça. Pour retrouver les anciens trucs, va falloir tout jointurer.
J'essaye de re-générer des fichiers CSV les plus proches possibles des CSV version 2017.
C'est ici: http://data.cquest.org/geo_sirene/beta/ … ifs.csv.gz
Beaucoup de jointures, et bien sûr, impossible de reconstituer des données totalement manquantes comme l'effectif à la centaine près, ou alors il va falloir utiliser d'autres sources.
Autre recul, les CSV version 2019 ne sont disponibles qu'en stocks mensuels, plus de CSV de mise à jour quotidiens.
J'ai là aussi tenté de les générer à partir de l'APIv3 de l'INSEE pour SIRENE et le résultat est là: http://data.cquest.org/geo_sirene/v2019/quotidien/
Bref, l'idée est est d'avoir un plan B pour une transition douce si jamais on ne peut pas s'adapter d'ici fin janvier 2019, car tout le monde ne peut pas modifier son SI en trois mois.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#25 Mon 12 November 2018 11:30
- grunt
- Participant actif
- Date d'inscription: 9 Nov 2010
- Messages: 90
Re: SIRENE géocodée... infos et discussions
Où es-tu parvenu à retrouver chez l'INSEE ou sur data.gouv.fr les données qui ont été supprimées des nouveaux fichiers StockUniteLegale et StockEtablissement ? Car certaines d'entre-elles, je les trouvais bien.
Hors ligne
#26 Wed 14 November 2018 12:28
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Où es-tu parvenu à retrouver chez l'INSEE ou sur data.gouv.fr les données qui ont été supprimées des nouveaux fichiers StockUniteLegale et StockEtablissement ? Car certaines d'entre-elles, je les trouvais bien.
Elles sont regénérées par croisement avec le COG et différentes nomenclatures.
C'est peut être pas parfait, donc les retours sont les bienvenus (même les négatifs, et ouais).
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#27 Fri 23 November 2018 14:25
- grunt
- Participant actif
- Date d'inscription: 9 Nov 2010
- Messages: 90
Re: SIRENE géocodée... infos et discussions
Une liste de correspondance SIRENE 2018 - 2019 a été publiée, elle facilitera la migration.
https://github.com/ColinMaudry/sirene-l … vs2019.csv
Je viens de finir la mienne, mais j'ai encore des bizarreries.
Particulièrement, des entreprises mono-établissement qui sont actives mais leur établissement, unique donc, lui est fermé.
Et alors, je ne sais pas quoi en conclure.
Hors ligne
#28 Fri 23 November 2018 17:41
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 871
Re: SIRENE géocodée... infos et discussions
Une liste de correspondance SIRENE 2018 - 2019 a été publiée, elle facilitera la migration.
https://github.com/ColinMaudry/sirene-l … vs2019.csv
Je viens de finir la mienne, mais j'ai encore des bizarreries.
Particulièrement, des entreprises mono-établissement qui sont actives mais leur établissement, unique donc, lui est fermé.
Et alors, je ne sais pas quoi en conclure.
Il y a aussi des incohérences entre stock v2017 et v2019 à une même date.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase
Hors ligne
#29 Sun 13 January 2019 12:38
- grunt
- Participant actif
- Date d'inscription: 9 Nov 2010
- Messages: 90
Re: SIRENE géocodée... infos et discussions
Ouf, ça y est.
Moi aussi je suis parvenu à exploiter ce diable de nouveau fichier SIRENE.
J'ai produit une carte des activités principales des entreprises basées dans les communes à partir de leur code APE.
Sur la carte en pièce jointe, apparaissent les trois premières sections NAF (le premier niveau des codes NAF) des activités qui ont le plus grand nombre de salariés, d'après des données de Septembre 2018.
A : Agriculture, sylviculture et pêche
B : Industries extractives
C : Industrie manufacturière
D : Production et distribution d'électricité, de gaz, de vapeur et d'air conditionné
E : Production et distribution d'eau ; assainissement, gestion des déchets et dépollution
F : Construction
G : Commerce ; réparation d'automobiles et de motocycles
H : Transports et entreposage
I : Hébergement et restauration
J : Information et communication
K : Activités financières et d'assurance
L : Activités immobilières
M : Activités spécialisées, scientifiques et techniques
N : Activités de services administratifs et de soutien
O : Administration publique
P : Enseignement
Q : Santé humaine et action sociale
R : Arts, spectacles et activités récréatives
S : Autres activités de services
T : Activités des ménages en tant qu'employeurs ; activités indifférenciées des ménages en tant que producteurs de biens et services pour usage propre
U : Activités extra-territoriales
Exemple : Douarnenez :
première activité : C : Industrie manufacturière, avec 1 626 salariés,
puis Q : Santé humaine et action sociale avec 1 605 salariés
puis G : Commerce ; réparation d'automobiles et de motocycles avec 978 salariés.
La première exécution avait duré quatre jours... Il a fallu batailler pour réduire ça à 20 minutes.
Dernière modification par grunt (Sun 13 January 2019 12:59)
Hors ligne
#30 Fri 17 May 2019 10:45
- yartostout
- Participant assidu
- Lieu: Bretagne
- Date d'inscription: 24 Jun 2015
- Messages: 173
Re: SIRENE géocodée... infos et discussions
@ Christian ou autres personne qui le sait ;-)
En ce qui concerne le geo_sirene_2017 téléchargeable sur le serveur de Christian, savez-vous s'il s'agit des établissements actifs seulement ?
Ou de l'ensemble des actifs et fermés ?
Je ne retrouve pas la variable les différenciant dans le fichier de correspondance du github...!
Merci à vous !
Hors ligne
- Sujet précédent - SIRENE géocodée... infos et discussions - Sujet suivant