- Sujet précédent - SIRENE géocodée... infos et discussions - Sujet suivant
#31 Sat 18 May 2019 08:13
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
Jusqu'à il y a peu, il n'y avait QUE les établissements actifs qui étaient diffusés par l'INSEE dans la base SIRENE opendata.
Depuis fin 2018, il y a aussi les entreprises qui ont cessé leur activité et les établissements fermés.
Dans http://data.cquest.org/geo_sirene/v2019/last il y a maintenant 3 fichiers des établissements:
- actifs seuls,
- fermés seuls,
- tout
Ces fichiers sont au nouveau format CSV.
Pour les fichiers à l'ancien format CSV, il n'y avait bien sûr que les établissements actifs.
Comme l'INSEE ne produit plus les fichiers à ce format et que tout le monde ne s'est pas forcément adapté aux nouveaux formats, je les reconstitue (retrosirene) à partir des nouveaux fichiers et j'ai là aussi séparé établissements actifs et fermés. Le champ actif/ferme (etatAdministratifEtablissement) a été remis dans IND_PUBLIPO (l'indicateur de publipostage, qui était toujours nul).
Voilà voilà
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#32 Mon 20 May 2019 08:59
- yartostout
- Participant assidu
- Lieu: Bretagne
- Date d'inscription: 24 Jun 2015
- Messages: 173
Re: SIRENE géocodée... infos et discussions
Super ! Merci pour ta réponse !
Hors ligne
#33 Mon 27 May 2019 11:00
- grunt
- Participant actif
- Date d'inscription: 9 Nov 2010
- Messages: 90
Re: SIRENE géocodée... infos et discussions
@yartostout : je suis en retard, je réagis à la fin de la page 1, je n'avais pas vu la page 2...
Dans sirene, selon le fichier (entreprise ou établissement)
ce sont les champs etatAdministratifUniteLegale
A : Active
C : Cessée
et etatAdministratifEtablissement
A : Actif
F : Fermé
Dernière modification par grunt (Mon 27 May 2019 11:02)
Hors ligne
#34 Fri 05 July 2019 09:10
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
La version de juillet géocodée est dispo (avec un peu de retard).
http://data.cquest.org/geo_sirene/v2019/
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#35 Fri 12 July 2019 18:38
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
J'ai aussi regénéré une version "retrosirene" pour celles et ceux qui dépendent de l'ancien format de fichier proposé par l'INSEE:
http://data.cquest.org/geo_sirene/last/
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#36 Tue 16 July 2019 09:34
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
Avis aux amateurs de données sur les entreprises... l'INPI a enfin changé la licence de diffusion du RNCS (Registre National du Commerce et des Sociétés), pour se rapprocher de la Licence Ouverte (même si ce n'est pas 100% de la LO).
Cela contient:
- les Immatriculations, Modifications et Radiations (IMR), y compris les dirigeants, mandataires, etc...
- les billans et comptes annuels
Voilà pour la bonne nouvelle, pour le reste, l'accès aux données se fait après ouverture d'un compte, par FTP sécurisé et surtout "façon puzzle" (plusieurs millions de fichiers CSV à télécharger).
Quelques explications ici: https://medium.com/@cq94/le-rncs-en-qua … 446c6fc8dd
J'ai remis les pièces du puzzle ensemble, pour un accès libre et faciliter la réutilisation sur http://data.cquest.org/inpi_rncs/
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#37 Thu 18 July 2019 16:33
- yartostout
- Participant assidu
- Lieu: Bretagne
- Date d'inscription: 24 Jun 2015
- Messages: 173
Re: SIRENE géocodée... infos et discussions
Bonjour à tous,
Est-il possible de modifier une données SIRENE ? Si oui, comment peut-on s'y prendre ?
Par exemple, une adresse qui n'est pas exacte ou un établissement actif mais en fait fermé...
Je peux faire la modif dans ma base mais, à la MAJ, je vais devoir réitérer l'exercice,
Merci d'avance,
Hors ligne
#38 Thu 18 July 2019 17:14
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
ça se fait via le CFE de l'entreprise concernée, mais je ne sais pas si seule l'entreprise peut le faire ou pas...
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#39 Thu 18 July 2019 17:22
- yartostout
- Participant assidu
- Lieu: Bretagne
- Date d'inscription: 24 Jun 2015
- Messages: 173
Re: SIRENE géocodée... infos et discussions
Merci, je travaille, pour l'instant, surtout avec les données liées aux commerces, dans la base SIRENE, donc je vais me tourner vers la CCI pour savoir comment ça se passe.
Hors ligne
#40 Fri 02 August 2019 11:29
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
La maxime "Début de mois... géo SIRENE en #opendata" se confirme encore une fois sur http://data.cquest.org/geo_sirene/v2019/
Et pour compléter, je republie désormais les données du RNCS (mal) diffusées par l'INPI:
http://data.cquest.org/inpi_rncs/
On y trouve les IMR (Immatriculations, Modification et Radiation) au RCS, ainsi que les comptes déposés par les entreprises au greffe.
Pour en savoir plus, un peu de lecture: https://medium.com/@cq94/le-rncs-en-qua … 446c6fc8dd
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#41 Mon 02 September 2019 15:23
- tevrard
- Participant assidu
- Date d'inscription: 23 May 2016
- Messages: 320
Re: SIRENE géocodée... infos et discussions
Bonjour,
Je cherche à savoir si il est toujours possible de détecter les établissements issus d'une création.
Je le faisais auparavant avec le champ "origine" mais il me semble, en parcourant la doc, que ce champ a disparu.
Quelqu'un peut il confirmer qu'il n'est plus possible de sortir cette information des fichiers?
Hors ligne
#42 Thu 26 September 2019 17:13
- allfab
- Participant occasionnel
- Date d'inscription: 9 Dec 2005
- Messages: 11
Re: SIRENE géocodée... infos et discussions
Bonjour,
J'ai également la même problématique. Avec l'ancienne version de la base SIRENE, j'avais créé un petit script qui me récupérait les MAJ mensuelles de la base. Dans les fichiers créés, il y avait notamment un champ VMAJ avec la nature de la mise à jour (création, suppression, modification) de l'établissement.
A priori, ce champ n'existe plus et n'a pas été remplacé. Ces fichiers me permettaient de mettre à jour ma base des entreprises sur un outil de gestion de relation clients. Ce dernier utilisait, entre autre, ce champ VMAJ pour mettre à jour sa liste d'entreprise.
Du coup, je ne vois pas comment il est possible de récupérer cette information ? J'ai passé pas mal de temps à éplucher la doc de l'API SIRENE et je ne vois pas comment remplacer cette information.
Si vous avec de quoi m'éclairer ?
Merci,
Fabien
Hors ligne
#43 Sat 28 September 2019 15:05
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
Si vous faites une mise à jour mensuelle, je conseille plutôt de tout écraser et remplacer.
L'INSEE ne diffuse plus de quoi faire des mises à jour fiables. Il y a trop de risque de perte d'information et de désynchronisation.
Plutôt que de consacrer du temps à tnter de recréer un substitut peu fiable à VMAJ, je pense que ce temps sera mieux investi dans une refonte pour écraser/remplacer globalement que par mise à jour ponctuelle.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#44 Fri 22 November 2019 10:47
- allfab
- Participant occasionnel
- Date d'inscription: 9 Dec 2005
- Messages: 11
Re: SIRENE géocodée... infos et discussions
Bonjour Christian,
Désolé pour ma réponse tardive et merci pour ce retour qui confirme bien mes craintes.
Notre structure utilise les données SIRENE depuis pas mal de temps et cela va être difficile de refondre notre BDD.
Bonne journée,
Fabien
Hors ligne
#45 Fri 17 January 2020 18:13
- zakarya2626
- Participant occasionnel
- Date d'inscription: 9 May 2019
- Messages: 13
Re: SIRENE géocodée... infos et discussions
Bonjour tout le monde ,
sur la base géo-codé je trouvé pleins de champs "Libtefet" qui ne sont pas renseignés alors que dans l'ancienne base ce n'était pas le cas .
il y a un truc qui m'échappe ?
Merci pour vos réponses
Hors ligne
#46 Mon 20 January 2020 10:17
- Astrakhan
- Participant assidu
- Date d'inscription: 6 Mar 2007
- Messages: 228
Re: SIRENE géocodée... infos et discussions
Tout à fait, les nouvelles données produites depuis 2017 (données afférentes aux établissements créés depuis cette date), ne contiennent plus d'informations sur la taille des établissements.
Bien cordialement
Hors ligne
#47 Tue 21 January 2020 09:19
- Djperou
- Juste Inscrit !
- Date d'inscription: 11 Mar 2014
- Messages: 6
Re: SIRENE géocodée... infos et discussions
Bonjour Astrakhan,
Auriez vous une source concernant cette information ? (ça m'aiderait bien car ma direction ne comprend pas les différences de qualité des données de la Base Sirene et j'ai du mal à trouver ce genre d'informations)
Merci d'avance !
Hors ligne
#48 Wed 22 January 2020 10:48
- Astrakhan
- Participant assidu
- Date d'inscription: 6 Mar 2007
- Messages: 228
Re: SIRENE géocodée... infos et discussions
Bonjour
En suivant le lien suivant vous accéderez au requeteur qui permet de sortir des extractions de la base https://www.sirene.fr/sirene/public/creation-fichier et pour l'item effectifs il y a un petit point d'interrorgation où, en cliquant dessus, l'information de limitation sur les effectifs récents vous apparaitra en toutes lettres.
Bien cordialement
Hors ligne
#49 Tue 09 June 2020 10:39
- Josendros
- Participant occasionnel
- Date d'inscription: 19 Jan 2012
- Messages: 22
Re: SIRENE géocodée... infos et discussions
Bonjour,
Savez-vous pourquoi les champs noms de l'enseigne ou la dénomination usuelle sont la plupart du temps non renseignés ?
merci de votre aide!
Hors ligne
#50 Tue 31 August 2021 19:43
- Sylvain M.
- Participant assidu
- Lieu: Saint-Pierre-des-Nids (53)
- Date d'inscription: 8 Sep 2005
- Messages: 995
Re: SIRENE géocodée... infos et discussions
Salut à tous,
Je viens de récupérer le fichier géocodé national des établissements actifs (http://data.cquest.org/geo_sirene/last/ … ifs.csv.gz).
Est-ce que quelqu'un aurait sous la main un script d'import (PSQL) dans PostGreSQL de cette table ?
Car une fois décompressé, le CSV fait 7,60 Go, ce qui exclue une édition pour apprécier la nature des champs (ou alors, je ne pratique pas les bons utilitaires).
Merci d'avance pour le partage !
Sylvain M.
Hors ligne
#51 Wed 01 September 2021 10:53
- Edouard Hyvernat
- Participant occasionnel
- Lieu: Vernon
- Date d'inscription: 24 Jan 2011
- Messages: 46
Re: SIRENE géocodée... infos et discussions
Au risque de me tromper, j'irai plutôt voir dans ce répertoire : http://data.cquest.org/geo_sirene/v2019/
Ensuite je prendrai un csv sur une commune quelconque pour avoir l'intitulé et le type des champs présent dans le csv. Je créerai un petit script sql qui comprendrait ma définition de table et je chargerai avec un COPY FROM le CSV global dans une seule table qui nécessiterait à minima d'avoir le champ geom indexé avant d'envisager de répartir cela en plusieurs schéma ou table.
Code:
CREATE TABLE schema.nom_de_la_table ( champ 1 varchar, champ 2 integer, etc.) ; --COPY FROM CSV COPY schema.nom_de_la_table FROM 'repertoire\du\csv\sirene.csv' DELIMITER ';' CSV HEADER NULL '' ENCODING 'WIN1252' ;
CSV HEADER --> si le csv comprend bien des en-tête
NULL '' --> pour charger correctement dans PG et éviter des erreurs en cas de valeurs nulles
ENCODING --> en fonction de votre base, 'UTF8' ou 'WIN1252'
Enregistrer le script dans un fichier .sql
Se placer dans le répertoire du fichier sql, lancer une console et la commande suivante :
psql -h localhost(ou adresse ip du serveur pg) -p 5432(ou autre port) -U postgres(ou autre superuser) -d sirene(ou autre nom de base) -f mon_script_sirene.sql
Dernière modification par Edouard Hyvernat (Wed 01 September 2021 10:58)
Hors ligne
#52 Wed 01 September 2021 10:59
Re: SIRENE géocodée... infos et discussions
Bonjour,
Allez dans https://github.com/cquest/geocodage-spd … 16/goodies
Lancer dans l'ordre (sous réserve d'avoir les CSV)
- sirene_geo_importe.sql
- sirene_geo_postgis.sql
Cordialement
Thomas
Hors ligne
#53 Wed 01 September 2021 11:00
- magr
- Participant occasionnel
- Date d'inscription: 30 Mar 2016
- Messages: 30
Re: SIRENE géocodée... infos et discussions
Un exemple qui fonctionnait en 2020 (je ne sais pas s'il y a eu des changements de format...).
Code:
-- pour générer la liste des champs dans le CREATE TABLE ci-dessous on fait avec la console OSGEO4W un -- head -n 1 geo_sirene.csv --> et on reformate cette ligne avec : -- passage en minuscule -- remplace "," par ",\n" -- remplace "," par " text," sauf : longitude numeric, latitude numeric, geo_score numeric -- DROP TABLE ref_sirene.sirene_000_2020; CREATE TABLE ref_sirene.sirene_000_2020 ( siren text, nic text, l1_normalisee text, l2_normalisee text, l3_normalisee text, l4_normalisee text, l5_normalisee text, l6_normalisee text, l7_normalisee text, l1_declaree text, l2_declaree text, l3_declaree text, l4_declaree text, l5_declaree text, l6_declaree text, l7_declaree text, numvoie text, indrep text, typvoie text, libvoie text, codpos text, cedex text, rpet text, libreg text, depet text, arronet text, ctonet text, comet text, libcom text, du text, tu text, uu text, epci text, tcd text, zemet text, siege text, enseigne text, ind_publipo text, diffcom text, amintret text, natetab text, libnatetab text, apet700 text, libapet text, dapet text, tefet text, libtefet text, efetcent text, defet text, origine text, dcret text, ddebact text, activnat text, lieuact text, actisurf text, saisonat text, modet text, prodet text, prodpart text, auxilt text, nomen_long text, sigle text, nom text, prenom text, civilite text, rna text, nicsiege text, rpen text, depcomen text, adr_mail text, nj text, libnj text, apen700 text, libapen text, dapen text, aprm text, ess text, dateess text, tefen text, libtefen text, efencent text, defen text, categorie text, dcren text, amintren text, monoact text, moden text, proden text, esaann text, tca text, esaapen text, esasec1n text, esasec2n text, esasec3n text, esasec4n text, vmaj text, vmaj1 text, vmaj2 text, vmaj3 text, datemaj text, latitude numeric, longitude numeric, geo_score numeric, geo_type text, geo_adresse text, geo_id text, geo_ligne text, geo_l4 text, geo_l5 text ) WITH ( OIDS=FALSE ) TABLESPACE default; ALTER TABLE ref_sirene.sirene_000_2020 OWNER TO add; GRANT ALL ON TABLE ref_sirene.sirene_000_2020 TO add; GRANT SELECT ON TABLE ref_sirene.sirene_000_2020 TO lecture; COMMENT ON TABLE ref_sirene.sirene_000_2020 IS 'Données SIRENE France. Données géocodées avec BAN et BANO (voir https://github.com/cquest/geocodage-sirene) Téléchargées depuis http://data.cquest.org/geo_sirene/last/ le 05/02/2020.'; -- ================================================================== -- Dans la console psql de PGAdmin ; environ 12 min -- ================================================================== \copy ref_sirene.sirene_000_2020 from D:\temp\sirene\geo_sirene.csv with (format csv, header true, encoding 'UTF-8'); -- ================================================================== -- FIN console -- ================================================================== -- 1 heure /* ajoute la colonne géométrique */ ALTER TABLE ref_sirene.sirene_000_2020 ADD geom geometry(point, 2154); /* mise à jour de la colonne géométrique */ UPDATE ref_sirene.sirene_000_2020 SET geom = st_transform(st_setsrid(st_makepoint(longitude, latitude), 4326), 2154); /* création de l'index géométrique */ CREATE INDEX sirene_000_2020_geom ON ref_sirene.sirene_000_2020 USING gist (geom); /* siret */ ALTER TABLE ref_sirene.sirene_000_2020 ADD COLUMN siret character varying(14); UPDATE ref_sirene.sirene_000_2020 SET siret = siren || nic; ALTER TABLE ref_sirene.sirene_000_2020 ADD CONSTRAINT sirene_000_2020_pk PRIMARY KEY (siret); -- durée 30 min CREATE INDEX sirene_000_2020_apen700_idx ON ref_sirene.sirene_000_2020 USING btree (apen700 varchar_pattern_ops); CREATE INDEX sirene_000_2020_apet700_idx ON ref_sirene.sirene_000_2020 USING btree (apet700 varchar_pattern_ops); CREATE INDEX sirene_000_2020_natetab_idx ON ref_sirene.sirene_000_2020 USING btree (natetab); CREATE INDEX sirene_000_2020_tefet_idx ON ref_sirene.sirene_000_2020 USING btree (tefet); CREATE INDEX sirene_000_2020_tefen_idx ON ref_sirene.sirene_000_2020 USING btree (tefen); CREATE INDEX sirene_000_2020_nj_idx ON ref_sirene.sirene_000_2020 USING btree (nj); CREATE INDEX sirene_000_2020_nomen_long_gin ON ref_sirene.sirene_000_2020 USING gin (nomen_long gin_trgm_ops); CREATE INDEX sirene_000_2020_l1_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin (l1_normalisee gin_trgm_ops); CREATE INDEX sirene_000_2020_l2_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin (l2_normalisee gin_trgm_ops); CREATE INDEX sirene_000_2020_siege_idx ON ref_sirene.sirene_000_2020 USING btree (siege); CREATE INDEX sirene_000_2020_depcomen_idx ON ref_sirene.sirene_000_2020 USING btree (depcomen); --Doc : https://www.sirene.fr/static-resources/doc/dessin_L2_description_complete.pdf?version=1.14'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.siren IS 'Identifiant de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.nic IS 'Numéro interne de classement de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_normalisee IS 'Première ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_normalisee IS 'Deuxième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_normalisee IS 'Troisième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_normalisee IS 'Quatrième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_normalisee IS 'Cinquième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_normalisee IS 'Sixième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_normalisee IS 'Septième ligne de l’adressage de l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_declaree IS 'Première ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_declaree IS 'Deuxième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_declaree IS 'Troisième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_declaree IS 'Quatrième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_declaree IS 'Cinquième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_declaree IS 'Sixième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_declaree IS 'Septième ligne de l’adressage déclaré pour l’établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.numvoie IS 'Numéro dans la voie'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.indrep IS 'Indice de répétition'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.typvoie IS 'Type de voie de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libvoie IS 'Libellé de voie de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.codpos IS 'Code postal'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.cedex IS 'Code CEDEX'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpet IS 'Région de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libreg IS 'Libellé de la région'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.depet IS 'Département de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.arronet IS 'Arrondissement de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.ctonet IS 'Canton de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.comet IS 'Commune de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libcom IS 'Libellé de la commune de localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.du IS 'Département de l''unité urbaine de la localisation de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.tu IS 'Taille de l''unité urbaine'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.uu IS 'Numéro de l''unité urbaine'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.epci IS 'Localisation de l''établissement dans un établissement public de coopération intercommunal'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.tcd IS 'Tranche de commune détaillée'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.zemet IS 'Zone d''emploi'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.siege IS 'Qualité de siège ou non de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.enseigne IS 'Enseigne ou nom de l''exploitation'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.ind_publipo IS 'Indicateur du champ du publipostage'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.diffcom IS 'Statut de diffusion de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintret IS 'Année et mois d''introduction de l''établissement dans la base de diffusion'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.natetab IS 'Nature de l''établissement d''un entrepreneur individuel'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnatetab IS 'Libellé de la nature de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.apet700 IS 'Activité principale de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapet IS 'Libellé de l''activité principale de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapet IS 'Année de validité de l''activité principale de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefet IS 'Tranche d''effectif salarié de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefet IS 'Libellé de la tranche d''effectif de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.efetcent IS 'Effectif salarié de l''établissement à la centaine près'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.defet IS 'Année de validité de l''effectif salarié de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.origine IS 'Origine de la création de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcret IS 'Année et mois de création de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.ddebact IS 'Date de début d’activité'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.activnat IS 'Nature de l''activité de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.lieuact IS 'Lieu de l''activité de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.actisurf IS 'Type de magasin'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.saisonat IS 'Caractère saisonnier ou non de l''activité de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.modet IS 'Modalité de l''activité principale de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodet IS 'Caractère productif de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodpart IS 'Participation particulière à la production de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.auxilt IS 'Caractère auxiliaire de l''activité de l''établissement'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.nomen_long IS 'Nom ou raison sociale de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.sigle IS 'Sigle de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.nom IS 'Nom de naissance'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.prenom IS 'Prénom'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.civilite IS 'Civilité des entrepreneurs individuels'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.rna IS 'Numéro d’identification au répertoire national des associations'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.nicsiege IS 'Numéro interne de classement de l''établissement siège'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpen IS 'Région de localisation du siège de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.depcomen IS 'Département et commune de localisation du siège de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.adr_mail IS 'Adresse mail'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.nj IS 'Nature juridique de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnj IS 'Libellé de la nature juridique'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.apen700 IS 'Activité principale de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapen IS 'Libellé de l''activité principale de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapen IS 'Année de validité de l''activité principale de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.aprm IS 'Activité principale au registre des métiers'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.ess IS 'Appartenance au champ de l’économie sociale et solidaire'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.dateess IS 'Date ESS'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefen IS 'Tranche d''effectif salarié de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefen IS 'Libellé de la tranche d''effectif de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.efencent IS 'Effectif salarié de l''entreprise à la centaine près'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.defen IS 'Année de validité de l''effectif salarié de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.categorie IS 'Catégorie d''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcren IS 'Année et mois de création de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintren IS 'Année et mois d''introduction de l''entreprise dans la base de diffusion'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.monoact IS 'Indice de monoactivité de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.moden IS 'Modalité de l''activité principale de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.proden IS 'Caractère productif de l''entreprise'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaann IS 'Année de validité des rubriques de niveau entreprise en provenance de l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.tca IS 'Tranche de chiffre d''affaires pour les entreprises enquêtées par l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaapen IS 'Activité principale de l''entreprise issue de l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec1n IS 'Première activité secondaire déclarée dans l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec2n IS 'Deuxième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec3n IS 'Troisième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec4n IS 'Quatrième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj IS 'Nature de la mise à jour (création, suppression, modification)'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj1 IS 'Indicateur de mise à jour n°1'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj2 IS 'Indicateur de mise à jour n°2'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj3 IS 'Indicateur de mise à jour n°3'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.datemaj IS 'Date de traitement de la mise à jour'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.longitude IS 'en degrés décimaux, WGS84'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.latitude IS 'en degrés décimaux, WGS84'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_score IS 'indice de similarité fournit par le moteur de géocodage'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_type IS '"housenumber" = n° trouvé, "interpolation" = n° interpolé, "street" = voie trouvée, "locality" = lieu-dit (ou position de la mairie) pour les adresses indiquées "MAIRIE" ou "HOTEL DE VILLE", "municipality" = position de la commune car l''adresse n''a pas été trouvée.'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_adresse IS 'libellé de l''adresse trouvée'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_id IS 'id dans le référentiel BAN, ou BANO (si commence par "BANO_")'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_ligne IS 'ligne d''adresse géocodée (G = géographique, N = normalisée, D = déclarée)'; COMMENT ON COLUMN ref_sirene.sirene_000_2020.siret IS 'SIRET (clé primaire)'; -- DROP VIEW ref_sirene.sirene_000; CREATE OR REPLACE VIEW ref_sirene.sirene_000 AS SELECT * FROM ref_sirene.sirene_000_2020; ALTER TABLE ref_sirene.sirene_000 OWNER TO add; GRANT ALL ON TABLE ref_sirene.sirene_000 TO add; GRANT SELECT ON TABLE ref_sirene.sirene_000 TO lecture; COMMENT ON VIEW ref_sirene.sirene_000 IS 'Vue pointant sur la version la plus récente de SIRENE';
Dernière modification par magr (Wed 01 September 2021 11:04)
Hors ligne
#54 Thu 02 September 2021 11:42
- Sylvain M.
- Participant assidu
- Lieu: Saint-Pierre-des-Nids (53)
- Date d'inscription: 8 Sep 2005
- Messages: 995
Re: SIRENE géocodée... infos et discussions
j'irai plutôt voir dans ce répertoire : http://data.cquest.org/geo_sirene/v2019/
Merci du conseil ! (en fait, j'ai beau lire les readme, j'ai du mal à comprendre la différence)
Du coup, le CSV national est bien plus petit : "StockEtablissementActif_utf8_geo.csv.gz" ne fait "que" 958 Mo !
Après, pour les commandes COPY et PSQL, pas de souci, je m'en sors.
Mais c'était pour récupérer la liste des champs dans l'entête du CSV que j'avais du mal.
Du coup, j'ai voulu tester la solution de MAGR, avec OsGeo4W :
Code:
-- pour générer la liste des champs dans le CREATE TABLE ci-dessous on fait avec la console OSGEO4W un -- head -n 1 geo_sirene.csv --> et on reformate cette ligne avec : -- passage en minuscule -- remplace "," par ",\n" -- remplace "," par " text," sauf : longitude numeric, latitude numeric, geo_score numeric
Malheureusement, quand je lance "C:\OSGeo4W\OSGeo4W.bat", la commande 'head' n’est pas reconnu en tant que commande interne
ou externe, un programme exécutable ou un fichier de commandes....
Mais bon, en essayant la commande PSQL :
Code:
SIG=# \copy ref_sirene.sirene_008_2021 from D:\SIG\INSEE\SIRENE\etablissements_actifs\etablissements_actifs.csv with (format csv, header true, encoding 'UTF-8');
Je fais face à un nouveau problème :
Code:
n'a pas pu tester le fichier « D:/SIG/INSEE/SIRENE/etablissements_actifs/etablissements_actifs.csv » : Unknown error SIG=#
Et je crois que c'est un problème connu sous Windows avec les fichiers très volumineux : https://www.postgresql.org/message-id/1 … gresql.org
Bref, pas si simple
Mais je vais y arriver en mélangeant un peu vos propositions !
[edit]
Pour la commande "head", je m'en suis sorti avec la commande powershell :
Code:
Get-Content "D:\monfichier.csv" | select -First 1 | Out-File "D:\monfichier_entetes.csv"
Dernière modification par Sylvain M. (Thu 02 September 2021 11:56)
Sylvain M.
Hors ligne
#55 Thu 02 September 2021 11:52
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
Voici ma recette...
Pour créer les tables PG avec les colonnes du CSV (tout en text):
Code:
psql -c "create table if not exists insee_siren (`unzip -p StockUniteLegale_utf8.zip | head -n 1 | sed 's/,/ text,/g;s/$/ text/'`);" psql -c "create table insee_siret (`gunzip -c StockEtablissement_utf8_geo.csv.gz | head -n 1 | sed 's/,/ text,/g;s/$/ text/'`);"
Ensuite l'import...
Code:
unzip -p StockUniteLegale_utf8.zip | psql -c "truncate insee_siren; copy insee_siren from stdin with (format csv, header true)" gunzip -c StockEtablissement_utf8_geo.csv.gz | psql -c "copy insee_siret from stdin with (format csv, header true)"
Par contre, c'est pas pour Windows
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#56 Thu 02 September 2021 12:13
- Sylvain M.
- Participant assidu
- Lieu: Saint-Pierre-des-Nids (53)
- Date d'inscription: 8 Sep 2005
- Messages: 995
Re: SIRENE géocodée... infos et discussions
Par contre, c'est pas pour Windows
sniff
Sylvain M.
Hors ligne
#57 Thu 02 September 2021 13:29
Re: SIRENE géocodée... infos et discussions
Sous Windows, vous pouvez installer et utiliser le sous-système Linux https://docs.microsoft.com/fr-fr/window … tall-win10
Jean-Marie
Azimut
Hors ligne
#58 Fri 03 September 2021 11:17
- Sylvain M.
- Participant assidu
- Lieu: Saint-Pierre-des-Nids (53)
- Date d'inscription: 8 Sep 2005
- Messages: 995
Re: SIRENE géocodée... infos et discussions
Sous Windows, vous pouvez installer et utiliser le sous-système Linux
En effet, on me l'a déjà conseillé, et je n'ai pas encore exploré ces possibilités.
J'espère trouver le temps !
En attendant, je m'en suis sorti en chargeant le CSV StockEtablissement_utf8_geo.csv dans QGis et en l'important dans ma base PostGreSQL via le Gestionnaire de BD de QGis.
Pas de problème de poids de fichiers cette fois, contraîrement à PSQL.
Par contre, Christian (ou quelqu'un d'autre qui a compris), peux-tu m'expliquer la différence entre les données disponibles dans ces 2 répertoires :
http://data.cquest.org/geo_sirene/last/
http://data.cquest.org/geo_sirene/v2019/last/
J'ai bien compris qu'il y avait un changement du format des fichier source en 2019, mais après je n'ai pas compris les différences de traitements entre ces 2 dossiers
Dernière modification par Sylvain M. (Fri 03 September 2021 11:17)
Sylvain M.
Hors ligne
#59 Fri 03 September 2021 12:26
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 875
Re: SIRENE géocodée... infos et discussions
v2019 contient les fichiers au format actuel, qui, entre autre, sépare unités légales et établissements et a tous les noms des champs modifiés (ou presque).
L'autre c'est une version "retrosirene" que je recrée au plus proche pour ceux qui n'ont toujours pas basculé vers le nouveau format... mais le géocodage n'est fait qu'une fois sur v2019, réutilisé pour généré cette version legacy.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#60 Fri 03 September 2021 12:45
- Sylvain M.
- Participant assidu
- Lieu: Saint-Pierre-des-Nids (53)
- Date d'inscription: 8 Sep 2005
- Messages: 995
Re: SIRENE géocodée... infos et discussions
Merci pour ces précision Christian.
Encore une question, désolé (liée à mon inculture sur cette BDD) : est-il normal que les dénominations des entreprises / établissements ne soient pas dans le fichier, alors qu'ils s'affichent bien quand on fait une recherche avec le SIREN sur - par exemple - l'annuaire des Entreprises (https://annuaire-entreprises.data.gouv.fr/). Quel(s) fichier(s) dois-je récupérer pour avoir les dénominations ?
Sylvain M.
Hors ligne
- Sujet précédent - SIRENE géocodée... infos et discussions - Sujet suivant