Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considèrerons que vous acceptez l'utilisation des cookies. J'ai compris ! ou En savoir plus !.
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

Annonce

GeoRezo est partenaire de l'évènement DécryptaGéo 2017, le rendez-vous indépendant des professionnels de l'information géographique.

Rendez-vous les 24 et 25 janvier 2017 à l'ENSG, cité Descartes, Noisy-Champs.

Retrouvez le programme de l'évènement et le formulaire d'inscription sur le site de DécryptaGéo

#1 ven. 15 janvier 2016 09:52

Fred
#JeSuisCharlie
Lieu: Paris
Date d'inscription: 24 juin 2005
Messages: 7254
Site web

SIRENE de l’Insee ouvert et gratuit en 2017

L’Etat poursuit sa politique d’ouverture des données publiques en ouvrant, gratuitement à partir du 1er janvier 2017, l’accès à la base Sirene de l’Insee. Une mine d'informations détaillées sur 9 millions d’entreprises et établissements français.

http://www.usine-digitale.fr/editorial/ … an.N373664


Fred


GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#2 mer. 20 janvier 2016 09:09

Jean-Michel
#jesuischarlie
Lieu: An Oriant /Lorient
Date d'inscription: 3 oct. 2005
Messages: 3484
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,
Lire notamment le billet sur le blog EtaLab : https://www.etalab.gouv.fr/louverture-d … lopen-data

Pour info, le message reçu de l'INSEE adressé à ses utilisateurs abonnés au répertoire SIRENE :

Envoyé : mardi 19 janvier 2016 14:24
Objet : Insee Sirene Diffusion - Gratuité du répertoire Sirene 2017
Importance : Haute

Bonjour,

Comme suite à l'annonce du mercredi 13 janvier 2016 de la secrétaire d'Etat au Numérique Axelle Lemaire,
" le répertoire SIRENE géré par l'Insee sera en accès ouvert et gratuit à compter du 1er janvier 2017" :
je tiens à vous informer que l'Insee doit attendre le vote de la loi pour une République numérique pour instruire précisément le dossier en fonction de son texte définitif.

Nous ne manquerons pas de revenir vers vous pour vous communiquer de plus amples informations, en fonction de l'avancement de cette instruction.

Les services associés aux produits Sirene qui vous sont fournis actuellement continuent, durant toute l'année 2016.

L'Equipe Sirene Diffusion


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#3 sam. 23 janvier 2016 19:49

Bruno
Membre du bureau
Lieu: Paris
Date d'inscription: 22 juin 2005
Messages: 9114
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonsoir,

Nous pourrions nous amuser à suivre ici, dans les mois et les années à venir, ce sujet.
http://www.nextinpact.com/news/98118-op … -2017.htm?

Bruno

Hors ligne

 

#4 dim. 24 janvier 2016 23:45

owlapps
Membre
Date d'inscription: 7 mars 2013
Messages: 43
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Super ! Combien y a t il  d'enregistrements et de tables pour cette base ?
histoire de préparer les serveurs

Hors ligne

 

#5 lun. 25 janvier 2016 10:01

Jean-Michel
#jesuischarlie
Lieu: An Oriant /Lorient
Date d'inscription: 3 oct. 2005
Messages: 3484
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,
Pour ceux qui sont actuellement abonnés à ces données, une seule table est fournie, mais elle est à compléter par des tables de nomenclatures :
Voir notamment :
- http://www.insee.fr/fr/methodes/default … af2008.htm
- http://www.insee.fr/fr/methodes/default … /cj/cj.htm
et donc à restructurer...

Pour le nombre de lignes, je n'ai pas trouvé l'info à l'échelle nationale. De l'ordre de 15 à 20 Millions ?
(mais tous les utilisateurs n'ont et n'auront pas la nécessité de disposer de cette base à l'échelle nationale)
On peut également supposer que la donnée "libérée" ne sera pas aussi complète que celle qui est actuellement fournie aux abonnés (actuellement environ 90 champs), et avec une périodicité de mise à jour différente...
On peut aussi supputer qu'elle sera délivrée selon un découpage administratif (départements par ex) pour faciliter les téléchargements.

[Hors sujet]
A noter dans l'article fourni par Bruno, et dans un autre domaine, l'accès nouveau à des données Météo-France (lire les commentaires)
Bonne journée


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#6 mar. 26 janvier 2016 16:59

Jean-Michel
#jesuischarlie
Lieu: An Oriant /Lorient
Date d'inscription: 3 oct. 2005
Messages: 3484
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,
En attendant, il y a une ressource très intéressante, réalisée pour Infogreffe, le portail des greffes des tribunaux de commerce
https://datainfogreffe.fr/page/home/.
L'open Data, c'est bath, vu comme çà !
PS : ne vous lancez pas tous en même temps à faire des requêtes, pour éviter de faire tomber le serveur, qui ne mérite pas çà  smile !


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#7 ven. 21 octobre 2016 09:56

AlineC
Moderateur
Lieu: AVIGNON
Date d'inscription: 5 sept. 2005
Messages: 1464
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,

A ce sujet un hackathon pour préparer l’ouverture de la base Sirene de l’Insee :
"Avancée majeure pour l’open data, la base Sirene de l’Insee sera ouverte début janvier 2017. Afin que cette ouverture se déroule dans les meilleures conditions, l’Insee, en partenariat avec Etalab, organise le 15 novembre un hackathon au SenseSpace. Développeurs, data-scientists et porteurs de projets sont invités à s’inscrire pour travailler durant une journée sur ce référentiel des entreprises et à en proposer de nouveaux usages."
https://www.etalab.gouv.fr/opensirene-u … ses-sirene

A +

Hors ligne

 

#8 lun. 02 janvier 2017 16:54

owlapps
Membre
Date d'inscription: 7 mars 2013
Messages: 43
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

le fichier est géocodé ?
Existe t un groupe de contributeurs qui se dévouerait pour cette tâche ?

Hors ligne

 

#9 lun. 02 janvier 2017 22:13

cquest
Membre
Date d'inscription: 6 janv. 2013
Messages: 135

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonsoir,

J'ai géocodé ces données pour le hackathon opensirene qui s'est tenu il y a quelques semaines.
Ce géocodage a été fait à l'aide de la BAN et complété par BANO (pour les lieux-dits) et les données géocodées de la version du mois de juin 2016 de SIRENE avaient été diffusées lors du hackathon.

J'ai à cette occasion écrit un script python publié sur https://github.com/cquest/geocodage-sirene pour mettre en forme les données et utiliser le géocodeur addok qui alimente l'API de géocodage de la BAN sur adresse.data.gouv.fr. Deux instances d'addok (une pour la BAN, une pour BANO) ont été utilisées.

Des statistiques sur le résultat sont disponibles sur le repo github qui arrive à plus de 95% de résultat dans de nombreux départements (99,4% à Paris).
Le script gère par exemple des adresses génériques comme "MAIRIE" que l'on retrouve pour pas mal d'associations et remplace cette pseudo adresse par les données de localisation des mairies diffusées par la DILA en opendata.

Je vais voir comment procéder à un géocodage régulier de ces données afin d'éviter que ce travail soit fait et refait en sollicitant inutilement des API de géocodage pour obtenir le même résultat. Les données géocodées devraient être disponibles prochainement sur data.gouv.fr

SIRENE sera il me semble livrée en stock mensuel + mises à jour quotidiennes.


Christian Quest
membre d'OpenStreetMap France
@cq94 sur twitter

Hors ligne

 

#10 jeu. 05 janvier 2017 09:26

jdeniel
Membre
Lieu: Rennes
Date d'inscription: 12 sept. 2005
Messages: 24

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour à tous,

les données SIRENE viennent d'être libérées et sont disponibles sur data.gouv.fr : http://www.data.gouv.fr/fr/datasets/bas … ren-siret/

Une page d'information est également accessible sur le site sirene : https://www.sirene.fr/sirene/public/sta … es-donnees

Le géocodage et le partage de sa méthode de production est très précieux. Merci pour ce travail et ce partage !


Julien Déniel - EPF Bretagne

Hors ligne

 

#11 jeu. 05 janvier 2017 11:18

cquest
Membre
Date d'inscription: 6 janv. 2013
Messages: 135

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Je suis en train de géocoder SIRENE comme je l'avais fait pour le hackathon.

J'espère avoir ça terminé ce soir ou demain...


Christian Quest
membre d'OpenStreetMap France
@cq94 sur twitter

Hors ligne

 

#12 lun. 09 janvier 2017 11:50

magr
Membre
Date d'inscription: 30 mars 2016
Messages: 10

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Merci pour cette contribution très utile.

cquest a écrit:

Je suis en train de géocoder SIRENE comme je l'avais fait pour le hackathon.

J'espère avoir ça terminé ce soir ou demain...

Hors ligne

 

#13 mar. 10 janvier 2017 10:39

ChristopheV
Membre
Lieu: Ajaccio
Date d'inscription: 7 sept. 2005
Messages: 2206
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,

Je viens de télécharger les données, il est tout de même regrettable de ne pas avoir un fichier par département ou par région ...

Deuxièmement le geocodage par l'adresse c'est vraiment pas terrible. Bon un petit croisement avec les personne morales des données MAJIC et ça va mieux.


Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close

Hors ligne

 

#14 mar. 10 janvier 2017 12:41

Jean-Michel
#jesuischarlie
Lieu: An Oriant /Lorient
Date d'inscription: 3 oct. 2005
Messages: 3484
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,

il est tout de même regrettable de ne pas avoir un fichier par département ou par région ...

Il est possible de télécharger les données "à façon" (par territoire, secteur d'activités etc...).
Mais la fabrication de ces fichiers est limité à 100 000 lignes. j'ai testé sur mon département : çà dépasse...
Il faut donc le faire en plusieurs fois par listes de communes...
A faire ici : https://www.sirene.fr/sirene/public/creation-fichier
(il faut disposer d'un compte).

le geocodage par l'adresse c'est vraiment pas terrible

De ce que j'en sais, la BAN utilise en tout ou partie des adresses géocodées à partir de MAJIC/PCI vecteur, il me semble...
Géomatiquement


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#15 mar. 10 janvier 2017 13:43

ChristopheV
Membre
Lieu: Ajaccio
Date d'inscription: 7 sept. 2005
Messages: 2206
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,

Merci JM

la BAN utilise en tout ou partie des adresses géocodées à partir de MAJIC/PCI vecteur, il me semble...

De ce que je constate dans les données il me semble aussi. Notre problème est l'absence d'adressage correct en milieu rural. La plus part des adresses hors les deux agglo principales est constituée par le lieudit, absence de nom et de numéros de rue ...


Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close

Hors ligne

 

#16 mar. 10 janvier 2017 19:05

Bruno
Membre du bureau
Lieu: Paris
Date d'inscription: 22 juin 2005
Messages: 9114
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonsoir les anciens!

Pourquoi ne pas collaborer avec Christian, qui partage sa démarche ici?
https://cquest.hackpad.com/Gocodage-de- … D8M4P7qMZR

Le forum garde tout son intérêt pour échanger des idées.

Bonne soirée,

Bruno

Hors ligne

 

#17 mer. 11 janvier 2017 08:32

Jean-Michel
#jesuischarlie
Lieu: An Oriant /Lorient
Date d'inscription: 3 oct. 2005
Messages: 3484
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour Bruno,
L'avantage avec Christian, c'est qu'il fait le job avant qu'on ait eu le temps de demander quoi que se soit.
Impressionnant le travail réalisé !
Et tout y est : un découpage départemental des fichiers, des stats, du nettoyage...
Un grand merci, Christian !

Une question (à Christian) : dans ce processus "bénévole", comment seront intégrées les mise à jour du SIRENE ?
Géomatiquement


Jean-Michel
GeoRezo, c'est des blogs, un wiki, un Netvibes ...
GeoRezo vous aide ==> Aidez GeoRezo !

Hors ligne

 

#18 mer. 11 janvier 2017 10:06

FPNO
Membre
Date d'inscription: 24 oct. 2013
Messages: 88

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour à tous

Excellent boulot de Christian !

Hors ligne

 

#19 mer. 11 janvier 2017 14:21

Marc Leobet
Membre
Lieu: La Défense
Date d'inscription: 19 sept. 2005
Messages: 870
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

ChristopheV a écrit:

la BAN utilise en tout ou partie des adresses géocodées à partir de MAJIC/PCI vecteur, il me semble...

De ce que je constate dans les données il me semble aussi. Notre problème est l'absence d'adressage correct en milieu rural. La plus part des adresses hors les deux agglo principales est constituée par le lieudit, absence de nom et de numéros de rue ...

Bonjour,

pour cela, il y a la base de données dite "Géolocaux", produite par le CEREMA : http://www.ant.developpement-durable.go … -a764.html

Il semble qu'il y ait d'obscures restrictions CNIL, mais la base n'est pas totalement restreinte non plus (en tout cas pour les missions de service public, pour ce qu'en ai compris). Il faut tenter.

Cordialement


Marc Leobet
http://georezo.net/blog/inspire/
@MarcLeobet sur Twitter

Hors ligne

 

#20 mer. 11 janvier 2017 14:22

ChristopheV
Membre
Lieu: Ajaccio
Date d'inscription: 7 sept. 2005
Messages: 2206
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour,

BRAVO !! Effectivement Bruno (toujours de bon conseil wink ) il faut collaborer.

Pour ma part j'ai pas trop de connaissance en matière de BAN mais en matière de FANTOIR et autre MAJIC ...

Difficile pour moi compte tenu du volume de travail autre, de faire des tests rapidement,  de notre coté Tumasgiu a fait une extraction départemental du fichier brut via des commandes LINUX. Mais effectivement l'ENCODING et le formatage ...
Je voulais tenter une approche de croisement de ce fichier et des données MAJIC : approche multiple en combinant adresse,lieudit du plan (PCI), des parcelles (MAJIC), classement des locaux (MAJIC) commerce personne morale etc ...et une connaissance terrain pour au moins un tiers du territoire, histoire de vérifier la valeur du modèle théorique.

Christian a non seulement réalisé un travail remarquable mais il a su aussi mettre en exergue les points de contraintes.
La suite logique est l'intégration du fichier dans un schéma postgresql/postgis et la conception d'une logique d'intégration différentielle pour tenir compte des mises à jour régulière (et qui je l'ai constaté ne sont pas forcement dans l'ordre de création la mise à jour du 19 janvier comportait des commerce qui existent depuis au moins 20 ans).

La modération pourrait peut-être créer un fil dédié spécifique aux idées sur le sujet ?


Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close

Hors ligne

 

#21 mer. 11 janvier 2017 14:27

ChristopheV
Membre
Lieu: Ajaccio
Date d'inscription: 7 sept. 2005
Messages: 2206
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

NB:

Merci Marc pour l'info, messages croisés ...


Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close

Hors ligne

 

#22 mer. 11 janvier 2017 16:00

Toñito
Membre
Date d'inscription: 26 oct. 2005
Messages: 167
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour a tous et merci pour cet incroyable travail . j'aimerai apporter ici ma modeste contribution. Tout d'abord en ce qui concerne le format du fichier SIREN . Faire disparaitre tous les guillemets est à mon avis trop radical (Dans les champs il y hélas des libellés qui contiennent des  caractères qui sont des séparateurs de champs : point virgule .  voici la bonne manip  : remplacer les """ (triples guillemets par des guillemets simple .  Remplacer les espace+"" par rien et ""+ espace par rien, remplacer les "", par rien. ensuite on a un fichier propre sauf pour les lignes 1 392 259 et 1 392 260 ou "TARATATA";"ROUGE PETIT POIS" pose un problème sans blague aucune  Il faut effacer la chaine ";" et la remplacer par un espace , attention la raison sociale apparait deux fois sur chaque ligne .
Une fois cela fait on a un fichier propre que j'ai pu envoyer sous SQL Server :10 536 630 lignes. le fichier nettoyé en format CSV clean , avec tous les champs est dispo , ou puis-je le mettre pour que tous le monde en profite ?

Dernière modification par Toñito (mer. 11 janvier 2017 17:12)

Hors ligne

 

#23 mer. 11 janvier 2017 16:29

Marc Leobet
Membre
Lieu: La Défense
Date d'inscription: 19 sept. 2005
Messages: 870
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bonjour Toñito,

nous pourrions peut-être le publier dans le cadre du Hackathon sur l'urbanisme (voir #HackUrba) , sur des serveurs du SOeS (service statistique de l'environnement)?

Cordialement


Marc Leobet
http://georezo.net/blog/inspire/
@MarcLeobet sur Twitter

Hors ligne

 

#24 mer. 11 janvier 2017 17:02

Toñito
Membre
Date d'inscription: 26 oct. 2005
Messages: 167
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

ok dis moi comment et ou ..

Hors ligne

 

#25 ven. 13 janvier 2017 19:25

cquest
Membre
Date d'inscription: 6 janv. 2013
Messages: 135

Re: SIRENE de l’Insee ouvert et gratuit en 2017

J'ai déjà procédé à ce nettoyage, préalablement au géocodage.

Les scripts utilisés sont sur https://github.com/cquest/geocodage-sir … aster/2017

Les fichiers géocodés (et découpés par département) sont sur: http://212.47.238.202/geo_sirene/2016-12/

Tout ceci est en ressource communautaire sur data.gouv.fr: https://www.data.gouv.fr/fr/datasets/ba … ren-siret/

Vous avez aussi en bonus les scripts d'import postgres/postgis: https://github.com/cquest/geocodage-sir … er/goodies


Christian Quest
membre d'OpenStreetMap France
@cq94 sur twitter

Hors ligne

 

#26 sam. 14 janvier 2017 08:26

Tarkok
Membre
Date d'inscription: 9 janv. 2017
Messages: 2

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Vous faites du super boulot, merci pour le partage en tout cas, j'en avais justement besoin. heureusement que j'ai fouiner un peu avant de créer un post

Hors ligne

 

#27 Aujourd'hui 16:33

Marc Leobet
Membre
Lieu: La Défense
Date d'inscription: 19 sept. 2005
Messages: 870
Site web

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Merci Christian!


Marc Leobet
http://georezo.net/blog/inspire/
@MarcLeobet sur Twitter

Hors ligne

 

#28 Aujourd'hui 17:09

Le Masson
Membre
Date d'inscription: 5 sept. 2005
Messages: 16

Re: SIRENE de l’Insee ouvert et gratuit en 2017

Bien envoyé! ;-)

Une question "dans les coins" (ça m'embête de la poser avec ma casquette IGN, mais bon, je n'ai que celle là...): au passage, une donnée en licence ouverte est certes géocodée, mais elle se retrouve aussi en ODBL, donc "moins" utilisable. Non?

Hors ligne

 

Pied de page des forums

Powered by FluxBB

Partagez  |