banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

#31 Sat 18 May 2019 08:13

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Jusqu'à il y a peu, il n'y avait QUE les établissements actifs qui étaient diffusés par l'INSEE dans la base SIRENE opendata.

Depuis fin 2018, il y a aussi les entreprises qui ont cessé leur activité et les établissements fermés.

Dans http://data.cquest.org/geo_sirene/v2019/last il y a maintenant 3 fichiers des établissements:
- actifs seuls,
- fermés seuls,
- tout

Ces fichiers sont au nouveau format CSV.

Pour les fichiers à l'ancien format CSV, il n'y avait bien sûr que les établissements actifs.
Comme l'INSEE ne produit plus les fichiers à ce format et que tout le monde ne s'est pas forcément adapté aux nouveaux formats, je les reconstitue (retrosirene) à partir des nouveaux fichiers et j'ai là aussi séparé établissements actifs et fermés. Le champ actif/ferme (etatAdministratifEtablissement) a été remis dans IND_PUBLIPO (l'indicateur de publipostage, qui était toujours nul).

Voilà voilà smile


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#32 Mon 20 May 2019 08:59

yartostout
Participant assidu
Lieu: Bretagne
Date d'inscription: 24 Jun 2015
Messages: 173

Re: SIRENE géocodée... infos et discussions

Super ! Merci pour ta réponse !

Hors ligne

 

#33 Mon 27 May 2019 11:00

grunt
Participant actif
Date d'inscription: 9 Nov 2010
Messages: 90

Re: SIRENE géocodée... infos et discussions

@yartostout : je suis en retard, je réagis à la fin de la page 1, je n'avais pas vu la page 2...

Dans sirene, selon le fichier (entreprise ou établissement)
ce sont les champs etatAdministratifUniteLegale
A : Active
C : Cessée

et etatAdministratifEtablissement
A : Actif
F : Fermé

Dernière modification par grunt (Mon 27 May 2019 11:02)

Hors ligne

 

#34 Fri 05 July 2019 09:10

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

La version de juillet géocodée est dispo (avec un peu de retard).

http://data.cquest.org/geo_sirene/v2019/


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#35 Fri 12 July 2019 18:38

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

J'ai aussi regénéré une version "retrosirene" pour celles et ceux qui dépendent de l'ancien format de fichier proposé par l'INSEE:

http://data.cquest.org/geo_sirene/last/


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#36 Tue 16 July 2019 09:34

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Avis aux amateurs de données sur les entreprises... l'INPI a enfin changé la licence de diffusion du RNCS (Registre National du Commerce et des Sociétés), pour se rapprocher de la Licence Ouverte (même si ce n'est pas 100% de la LO).

Cela contient:
- les Immatriculations, Modifications et Radiations (IMR), y compris les dirigeants, mandataires, etc...
- les billans et comptes annuels

Voilà pour la bonne nouvelle, pour le reste, l'accès aux données se fait après ouverture d'un compte, par FTP sécurisé et surtout "façon puzzle" (plusieurs millions de fichiers CSV à télécharger).

Quelques explications ici: https://medium.com/@cq94/le-rncs-en-qua … 446c6fc8dd

J'ai remis les pièces du puzzle ensemble, pour un accès libre et faciliter la réutilisation sur http://data.cquest.org/inpi_rncs/


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#37 Thu 18 July 2019 16:33

yartostout
Participant assidu
Lieu: Bretagne
Date d'inscription: 24 Jun 2015
Messages: 173

Re: SIRENE géocodée... infos et discussions

Bonjour à tous,

Est-il possible de modifier une données SIRENE ? Si oui, comment peut-on s'y prendre ?
Par exemple, une adresse qui n'est pas exacte ou un établissement actif mais en fait fermé...

Je peux faire la modif dans ma base mais, à la MAJ, je vais devoir réitérer l'exercice,

Merci d'avance,

Hors ligne

 

#38 Thu 18 July 2019 17:14

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

ça se fait via le CFE de l'entreprise concernée, mais je ne sais pas si seule l'entreprise peut le faire ou pas...


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#39 Thu 18 July 2019 17:22

yartostout
Participant assidu
Lieu: Bretagne
Date d'inscription: 24 Jun 2015
Messages: 173

Re: SIRENE géocodée... infos et discussions

Merci, je travaille, pour l'instant, surtout avec les données liées aux commerces, dans la base SIRENE, donc je vais me tourner vers la CCI pour savoir comment ça se passe.

Hors ligne

 

#40 Fri 02 August 2019 11:29

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

La maxime "Début de mois... géo SIRENE en #opendata" se confirme encore une fois sur http://data.cquest.org/geo_sirene/v2019/

Et pour compléter, je republie désormais les données du RNCS (mal) diffusées par l'INPI:

http://data.cquest.org/inpi_rncs/

On y trouve les IMR (Immatriculations, Modification et Radiation) au RCS, ainsi que les comptes déposés par les entreprises au greffe.

Pour en savoir plus, un peu de lecture: https://medium.com/@cq94/le-rncs-en-qua … 446c6fc8dd


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#41 Mon 02 September 2019 15:23

tevrard
Participant assidu
Date d'inscription: 23 May 2016
Messages: 320

Re: SIRENE géocodée... infos et discussions

Bonjour,

Je cherche à savoir si il est toujours possible de détecter les établissements issus d'une création.

Je le faisais auparavant avec le champ "origine" mais il me semble, en parcourant la doc, que ce champ a disparu.

Quelqu'un peut il confirmer qu'il n'est plus possible de sortir cette information des fichiers?

Hors ligne

 

#42 Thu 26 September 2019 17:13

allfab
Participant occasionnel
Date d'inscription: 9 Dec 2005
Messages: 11

Re: SIRENE géocodée... infos et discussions

Bonjour,

J'ai également la même problématique. Avec l'ancienne version de la base SIRENE, j'avais créé un petit script qui me récupérait les MAJ mensuelles de la base. Dans les fichiers créés, il y avait notamment un champ VMAJ avec la nature de la mise à jour (création, suppression, modification) de l'établissement.

A priori, ce champ n'existe plus et n'a pas été remplacé. Ces fichiers me permettaient de mettre à jour ma base des entreprises sur un outil de gestion de relation clients. Ce dernier utilisait, entre autre, ce champ VMAJ pour mettre à jour sa liste d'entreprise.

Du coup, je ne vois pas comment il est possible de récupérer cette information ? J'ai passé pas mal de temps à éplucher la doc de l'API SIRENE et je ne vois pas comment remplacer cette information.

Si vous avec de quoi m'éclairer ?

Merci,
Fabien

Hors ligne

 

#43 Sat 28 September 2019 15:05

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Si vous faites une mise à jour mensuelle, je conseille plutôt de tout écraser et remplacer.

L'INSEE ne diffuse plus de quoi faire des mises à jour fiables. Il y a trop de risque de perte d'information et de désynchronisation.

Plutôt que de consacrer du temps à tnter de recréer un substitut peu fiable à VMAJ, je pense que ce temps sera mieux investi dans une refonte pour écraser/remplacer globalement que par mise à jour ponctuelle.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#44 Fri 22 November 2019 10:47

allfab
Participant occasionnel
Date d'inscription: 9 Dec 2005
Messages: 11

Re: SIRENE géocodée... infos et discussions

Bonjour Christian,

Désolé pour ma réponse tardive et merci pour ce retour qui confirme bien mes craintes.

Notre structure utilise les données SIRENE depuis pas mal de temps et cela va être difficile de refondre notre BDD.

Bonne journée,
Fabien

Hors ligne

 

#45 Fri 17 January 2020 18:13

zakarya2626
Participant occasionnel
Date d'inscription: 9 May 2019
Messages: 13

Re: SIRENE géocodée... infos et discussions

Bonjour tout le monde ,

sur la base géo-codé je trouvé pleins de champs "Libtefet" qui ne sont pas renseignés alors que dans l'ancienne base ce n'était pas le cas .

il y a un truc qui m'échappe ?

Merci pour vos réponses

Hors ligne

 

#46 Mon 20 January 2020 10:17

Astrakhan
Participant assidu
Date d'inscription: 6 Mar 2007
Messages: 228

Re: SIRENE géocodée... infos et discussions

Tout à fait, les nouvelles données produites depuis 2017 (données afférentes aux établissements créés depuis cette date), ne contiennent plus d'informations sur la taille des établissements.

Bien cordialement

Hors ligne

 

#47 Tue 21 January 2020 09:19

Djperou
Juste Inscrit !
Date d'inscription: 11 Mar 2014
Messages: 6

Re: SIRENE géocodée... infos et discussions

Bonjour Astrakhan,

Auriez vous une source concernant cette information ? (ça m'aiderait bien car ma direction ne comprend pas les différences de qualité des données de la Base Sirene et j'ai du mal à trouver ce genre d'informations)

Merci d'avance !

Hors ligne

 

#48 Wed 22 January 2020 10:48

Astrakhan
Participant assidu
Date d'inscription: 6 Mar 2007
Messages: 228

Re: SIRENE géocodée... infos et discussions

Bonjour

En suivant le lien suivant vous accéderez au requeteur qui permet de sortir des extractions de la base https://www.sirene.fr/sirene/public/creation-fichier et pour l'item effectifs il y a un petit point d'interrorgation où, en cliquant dessus, l'information de limitation sur les effectifs récents vous apparaitra en toutes lettres.

Bien cordialement

Hors ligne

 

#49 Tue 09 June 2020 10:39

Josendros
Participant occasionnel
Date d'inscription: 19 Jan 2012
Messages: 22

Re: SIRENE géocodée... infos et discussions

Bonjour,
Savez-vous pourquoi les champs noms de l'enseigne ou la dénomination usuelle sont la plupart du temps non renseignés ?

merci de votre aide!

Hors ligne

 

#50 Tue 31 August 2021 19:43

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 995

Re: SIRENE géocodée... infos et discussions

Salut à tous,
Je viens de récupérer le fichier géocodé national des établissements actifs (http://data.cquest.org/geo_sirene/last/ … ifs.csv.gz).
Est-ce que quelqu'un aurait sous la main un script d'import (PSQL) dans PostGreSQL de cette table ?
Car une fois décompressé, le CSV fait 7,60 Go, ce qui exclue une édition pour apprécier la nature des champs (ou alors, je ne pratique pas les bons utilitaires).
Merci d'avance pour le partage ! big_smile


Sylvain M.

Hors ligne

 

#51 Wed 01 September 2021 10:53

Edouard Hyvernat
Participant occasionnel
Lieu: Vernon
Date d'inscription: 24 Jan 2011
Messages: 46

Re: SIRENE géocodée... infos et discussions

Au risque de me tromper, j'irai plutôt voir dans ce répertoire : http://data.cquest.org/geo_sirene/v2019/

Ensuite je prendrai un csv sur une commune quelconque pour avoir l'intitulé et le type des champs présent dans le csv. Je créerai un petit script sql qui comprendrait ma définition de table et je chargerai avec un COPY FROM le CSV global dans une seule table qui nécessiterait à minima d'avoir le champ geom indexé avant d'envisager de répartir cela en plusieurs schéma ou table.

Code:

CREATE TABLE schema.nom_de_la_table (
champ 1 varchar,
champ 2 integer, 
etc.) ;

--COPY FROM CSV
COPY schema.nom_de_la_table FROM 'repertoire\du\csv\sirene.csv' DELIMITER ';' CSV HEADER NULL '' ENCODING 'WIN1252' ;

CSV HEADER --> si le csv comprend bien des en-tête
NULL '' --> pour charger correctement dans PG et éviter des erreurs en cas de valeurs nulles
ENCODING --> en fonction de votre base, 'UTF8' ou 'WIN1252'

Enregistrer le script dans un fichier .sql
Se placer dans le répertoire du fichier sql, lancer une console et la commande suivante :
psql -h localhost(ou adresse ip du serveur pg) -p 5432(ou autre port) -U postgres(ou autre superuser) -d sirene(ou autre nom de base) -f mon_script_sirene.sql

Dernière modification par Edouard Hyvernat (Wed 01 September 2021 10:58)

Hors ligne

 

#52 Wed 01 September 2021 10:59

ThomasG
Membre
Lieu: Nantes
Date d'inscription: 9 Sep 2005
Messages: 946
Site web

Re: SIRENE géocodée... infos et discussions

Bonjour,

Allez dans https://github.com/cquest/geocodage-spd … 16/goodies

Lancer dans l'ordre (sous réserve d'avoir les CSV)

- sirene_geo_importe.sql
- sirene_geo_postgis.sql


Cordialement

Thomas

Hors ligne

 

#53 Wed 01 September 2021 11:00

magr
Participant occasionnel
Date d'inscription: 30 Mar 2016
Messages: 30

Re: SIRENE géocodée... infos et discussions

Un exemple qui fonctionnait en 2020 (je ne sais pas s'il y a eu des changements de format...).


Code:

-- pour générer la liste des champs dans le CREATE TABLE ci-dessous on fait avec la console OSGEO4W un
-- head -n 1 geo_sirene.csv  --> et on reformate cette ligne avec :
-- passage en minuscule 
-- remplace "," par ",\n"
-- remplace "," par " text," sauf : longitude numeric, latitude numeric, geo_score numeric


-- DROP TABLE ref_sirene.sirene_000_2020;
CREATE TABLE ref_sirene.sirene_000_2020
(
siren text,
nic text,
l1_normalisee text,
l2_normalisee text,
l3_normalisee text,
l4_normalisee text,
l5_normalisee text,
l6_normalisee text,
l7_normalisee text,
l1_declaree text,
l2_declaree text,
l3_declaree text,
l4_declaree text,
l5_declaree text,
l6_declaree text,
l7_declaree text,
numvoie text,
indrep text,
typvoie text,
libvoie text,
codpos text,
cedex text,
rpet text,
libreg text,
depet text,
arronet text,
ctonet text,
comet text,
libcom text,
du text,
tu text,
uu text,
epci text,
tcd text,
zemet text,
siege text,
enseigne text,
ind_publipo text,
diffcom text,
amintret text,
natetab text,
libnatetab text,
apet700 text,
libapet text,
dapet text,
tefet text,
libtefet text,
efetcent text,
defet text,
origine text,
dcret text,
ddebact text,
activnat text,
lieuact text,
actisurf text,
saisonat text,
modet text,
prodet text,
prodpart text,
auxilt text,
nomen_long text,
sigle text,
nom text,
prenom text,
civilite text,
rna text,
nicsiege text,
rpen text,
depcomen text,
adr_mail text,
nj text,
libnj text,
apen700 text,
libapen text,
dapen text,
aprm text,
ess text,
dateess text,
tefen text,
libtefen text,
efencent text,
defen text,
categorie text,
dcren text,
amintren text,
monoact text,
moden text,
proden text,
esaann text,
tca text,
esaapen text,
esasec1n text,
esasec2n text,
esasec3n text,
esasec4n text,
vmaj text,
vmaj1 text,
vmaj2 text,
vmaj3 text,
datemaj text,
latitude numeric,
longitude numeric,
geo_score numeric,
geo_type text,
geo_adresse text,
geo_id text,
geo_ligne text,
geo_l4 text,
geo_l5 text


)
WITH (
  OIDS=FALSE
)
TABLESPACE default;
ALTER TABLE ref_sirene.sirene_000_2020
  OWNER TO add;
GRANT ALL ON TABLE ref_sirene.sirene_000_2020 TO add;
GRANT SELECT ON TABLE ref_sirene.sirene_000_2020 TO lecture;
COMMENT ON TABLE ref_sirene.sirene_000_2020
  IS 'Données SIRENE France.
Données géocodées avec BAN et BANO (voir https://github.com/cquest/geocodage-sirene)
Téléchargées depuis http://data.cquest.org/geo_sirene/last/
le 05/02/2020.';

  
-- ==================================================================  
-- Dans la console psql de PGAdmin ; environ 12 min
-- ==================================================================
\copy ref_sirene.sirene_000_2020 from D:\temp\sirene\geo_sirene.csv with (format csv, header true, encoding 'UTF-8');

-- ==================================================================  
-- FIN console
-- ==================================================================
-- 1 heure

/* ajoute la colonne géométrique */
ALTER TABLE ref_sirene.sirene_000_2020 ADD geom geometry(point, 2154);

/* mise à jour de la colonne géométrique */
UPDATE ref_sirene.sirene_000_2020 SET geom = st_transform(st_setsrid(st_makepoint(longitude, latitude), 4326), 2154);

/* création de l'index géométrique */
CREATE INDEX sirene_000_2020_geom ON ref_sirene.sirene_000_2020 USING gist (geom);


/* siret */
ALTER TABLE ref_sirene.sirene_000_2020 ADD COLUMN siret character varying(14);

UPDATE ref_sirene.sirene_000_2020 SET siret = siren || nic;

ALTER TABLE ref_sirene.sirene_000_2020
  ADD CONSTRAINT sirene_000_2020_pk PRIMARY KEY (siret);

-- durée 30 min

CREATE INDEX sirene_000_2020_apen700_idx ON ref_sirene.sirene_000_2020 USING btree (apen700 varchar_pattern_ops);
CREATE INDEX sirene_000_2020_apet700_idx ON ref_sirene.sirene_000_2020 USING btree (apet700 varchar_pattern_ops);
CREATE INDEX sirene_000_2020_natetab_idx ON ref_sirene.sirene_000_2020 USING btree (natetab);
CREATE INDEX sirene_000_2020_tefet_idx ON ref_sirene.sirene_000_2020 USING btree (tefet);
CREATE INDEX sirene_000_2020_tefen_idx ON ref_sirene.sirene_000_2020 USING btree (tefen);
CREATE INDEX sirene_000_2020_nj_idx ON ref_sirene.sirene_000_2020 USING btree (nj);
CREATE INDEX sirene_000_2020_nomen_long_gin ON ref_sirene.sirene_000_2020 USING gin (nomen_long gin_trgm_ops);
CREATE INDEX sirene_000_2020_l1_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin (l1_normalisee gin_trgm_ops);
CREATE INDEX sirene_000_2020_l2_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin (l2_normalisee gin_trgm_ops);
CREATE INDEX sirene_000_2020_siege_idx ON ref_sirene.sirene_000_2020 USING btree (siege);
CREATE INDEX sirene_000_2020_depcomen_idx ON ref_sirene.sirene_000_2020 USING btree (depcomen);

 
--Doc : https://www.sirene.fr/static-resources/doc/dessin_L2_description_complete.pdf?version=1.14';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siren IS 'Identifiant de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nic IS 'Numéro interne de classement de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_normalisee IS 'Première ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_normalisee IS 'Deuxième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_normalisee IS 'Troisième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_normalisee IS 'Quatrième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_normalisee IS 'Cinquième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_normalisee IS 'Sixième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_normalisee IS 'Septième ligne de l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_declaree IS 'Première ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_declaree IS 'Deuxième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_declaree IS 'Troisième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_declaree IS 'Quatrième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_declaree IS 'Cinquième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_declaree IS 'Sixième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_declaree IS 'Septième ligne de l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.numvoie IS 'Numéro dans la voie';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.indrep IS 'Indice de répétition';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.typvoie IS 'Type de voie de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libvoie IS 'Libellé de voie de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.codpos IS 'Code postal';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.cedex IS 'Code CEDEX';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpet IS 'Région de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libreg IS 'Libellé de la région';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.depet IS 'Département de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.arronet IS 'Arrondissement de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ctonet IS 'Canton de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.comet IS 'Commune de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libcom IS 'Libellé de la commune de localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.du IS 'Département de l''unité urbaine de la localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tu IS 'Taille de l''unité urbaine';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.uu IS 'Numéro de l''unité urbaine';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.epci IS 'Localisation de l''établissement dans un établissement public de coopération intercommunal';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tcd IS 'Tranche de commune détaillée';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.zemet IS 'Zone d''emploi';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siege IS 'Qualité de siège ou non de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.enseigne IS 'Enseigne ou nom de l''exploitation';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ind_publipo IS 'Indicateur du champ du publipostage';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.diffcom IS 'Statut de diffusion de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintret IS 'Année et mois d''introduction de l''établissement dans la base de diffusion';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.natetab IS 'Nature de l''établissement d''un entrepreneur individuel';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnatetab IS 'Libellé de la nature de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.apet700 IS 'Activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapet IS 'Libellé de l''activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapet IS 'Année de validité de l''activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefet IS 'Tranche d''effectif salarié de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefet IS 'Libellé de la tranche d''effectif de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.efetcent IS 'Effectif salarié de l''établissement à la centaine près';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.defet IS 'Année de validité de l''effectif salarié de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.origine IS 'Origine de la création de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcret IS 'Année et mois de création de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ddebact IS 'Date de début d’activité';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.activnat IS 'Nature de l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.lieuact IS 'Lieu de l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.actisurf IS 'Type de magasin';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.saisonat IS 'Caractère saisonnier ou non de l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.modet IS 'Modalité de l''activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodet IS 'Caractère productif de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodpart IS 'Participation particulière à la production de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.auxilt IS 'Caractère auxiliaire de l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nomen_long IS 'Nom ou raison sociale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.sigle IS 'Sigle de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nom IS 'Nom de naissance';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prenom IS 'Prénom';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.civilite IS 'Civilité des entrepreneurs individuels';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rna IS 'Numéro d’identification au répertoire national des associations';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nicsiege IS 'Numéro interne de classement de l''établissement siège';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpen IS 'Région de localisation du siège de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.depcomen IS 'Département et commune de localisation du siège de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.adr_mail IS 'Adresse mail';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nj IS 'Nature juridique de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnj IS 'Libellé de la nature juridique';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.apen700 IS 'Activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapen IS 'Libellé de l''activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapen IS 'Année de validité de l''activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.aprm IS 'Activité principale au registre des métiers';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ess IS 'Appartenance au champ de l’économie sociale et solidaire';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dateess IS 'Date ESS';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefen IS 'Tranche d''effectif salarié de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefen IS 'Libellé de la tranche d''effectif de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.efencent IS 'Effectif salarié de l''entreprise à la centaine près';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.defen IS 'Année de validité de l''effectif salarié de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.categorie IS 'Catégorie d''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcren IS 'Année et mois de création de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintren IS 'Année et mois d''introduction de l''entreprise dans la base de diffusion';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.monoact IS 'Indice de monoactivité de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.moden IS 'Modalité de l''activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.proden IS 'Caractère productif de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaann IS 'Année de validité des rubriques de niveau entreprise en provenance de l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tca IS 'Tranche de chiffre d''affaires pour les entreprises enquêtées par l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaapen IS 'Activité principale de l''entreprise issue de l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec1n IS 'Première activité secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec2n IS 'Deuxième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec3n IS 'Troisième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec4n IS 'Quatrième activité secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj IS 'Nature de la mise à jour (création, suppression, modification)';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj1 IS 'Indicateur de mise à jour n°1';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj2 IS 'Indicateur de mise à jour n°2';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj3 IS 'Indicateur de mise à jour n°3';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.datemaj IS 'Date de traitement de la mise à jour';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.longitude IS 'en degrés décimaux, WGS84';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.latitude IS 'en degrés décimaux, WGS84';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_score IS 'indice de similarité fournit par le moteur de géocodage';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_type IS '"housenumber" = n° trouvé, "interpolation" = n° interpolé, "street" = voie trouvée, "locality" = lieu-dit (ou position de la mairie) pour les adresses indiquées "MAIRIE" ou "HOTEL DE VILLE", "municipality" = position de la commune car l''adresse n''a pas été trouvée.';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_adresse IS 'libellé de l''adresse trouvée';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_id IS 'id dans le référentiel BAN, ou BANO (si commence par "BANO_")';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_ligne IS 'ligne d''adresse géocodée (G = géographique, N = normalisée, D = déclarée)';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siret IS 'SIRET (clé primaire)';



-- DROP VIEW ref_sirene.sirene_000;
CREATE OR REPLACE VIEW ref_sirene.sirene_000 AS 
 SELECT *
   FROM ref_sirene.sirene_000_2020;

ALTER TABLE ref_sirene.sirene_000
  OWNER TO add;
GRANT ALL ON TABLE ref_sirene.sirene_000 TO add;
GRANT SELECT ON TABLE ref_sirene.sirene_000 TO lecture;
COMMENT ON VIEW ref_sirene.sirene_000
  IS 'Vue pointant sur la version la plus récente de SIRENE';

Dernière modification par magr (Wed 01 September 2021 11:04)

Hors ligne

 

#54 Thu 02 September 2021 11:42

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 995

Re: SIRENE géocodée... infos et discussions

Edouard Hyvernat a écrit:

j'irai plutôt voir dans ce répertoire : http://data.cquest.org/geo_sirene/v2019/


Merci du conseil ! (en fait, j'ai beau lire les readme, j'ai du mal à comprendre la différence)
Du coup, le CSV national est bien plus petit : "StockEtablissementActif_utf8_geo.csv.gz" ne fait "que" 958 Mo !

Après, pour les commandes COPY et PSQL, pas de souci, je m'en sors.
Mais c'était pour récupérer la liste des champs dans l'entête du CSV que j'avais du mal.

Du coup, j'ai voulu tester la solution de MAGR, avec OsGeo4W :

Code:

-- pour générer la liste des champs dans le CREATE TABLE ci-dessous on fait avec la console OSGEO4W un
-- head -n 1 geo_sirene.csv  --> et on reformate cette ligne avec :
-- passage en minuscule 
-- remplace "," par ",\n"
-- remplace "," par " text," sauf : longitude numeric, latitude numeric, geo_score numeric

Malheureusement, quand je lance "C:\OSGeo4W\OSGeo4W.bat", la commande 'head' n’est pas reconnu en tant que commande interne
ou externe, un programme exécutable ou un fichier de commandes.
...

Mais bon, en essayant la commande PSQL :

Code:

SIG=# \copy ref_sirene.sirene_008_2021 from D:\SIG\INSEE\SIRENE\etablissements_actifs\etablissements_actifs.csv with (format csv, header true, encoding 'UTF-8');

Je fais face à un nouveau problème :

Code:

n'a pas pu tester le fichier « D:/SIG/INSEE/SIRENE/etablissements_actifs/etablissements_actifs.csv » : Unknown error
SIG=#

Et je crois que c'est un problème connu sous Windows avec les fichiers très volumineux : https://www.postgresql.org/message-id/1 … gresql.org

Bref, pas si simple wink
Mais je vais y arriver en mélangeant un peu vos propositions !

[edit]
Pour la commande "head", je m'en suis sorti avec la commande powershell :

Code:

Get-Content "D:\monfichier.csv" | select -First 1 | Out-File "D:\monfichier_entetes.csv"

Dernière modification par Sylvain M. (Thu 02 September 2021 11:56)


Sylvain M.

Hors ligne

 

#55 Thu 02 September 2021 11:52

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

Voici ma recette...

Pour créer les tables PG avec les colonnes du CSV (tout en text):

Code:

psql -c "create table if not exists insee_siren (`unzip -p StockUniteLegale_utf8.zip | head -n 1 | sed 's/,/ text,/g;s/$/ text/'`);"
psql -c "create table insee_siret (`gunzip -c StockEtablissement_utf8_geo.csv.gz | head -n 1 | sed 's/,/ text,/g;s/$/ text/'`);"

Ensuite l'import...

Code:

unzip -p StockUniteLegale_utf8.zip | psql -c "truncate insee_siren; copy insee_siren from stdin with (format csv, header true)"
gunzip -c StockEtablissement_utf8_geo.csv.gz | psql -c "copy insee_siret from stdin with (format csv, header true)"

Par contre, c'est pas pour Windows wink


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#56 Thu 02 September 2021 12:13

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 995

Re: SIRENE géocodée... infos et discussions

Par contre, c'est pas pour Windows wink


sniff


Sylvain M.

Hors ligne

 

#57 Thu 02 September 2021 13:29

jmarsac
Participant assidu
Lieu: NICE
Date d'inscription: 26 Oct 2005
Messages: 572
Site web

Re: SIRENE géocodée... infos et discussions

Sous Windows, vous pouvez installer et utiliser le sous-système Linux https://docs.microsoft.com/fr-fr/window … tall-win10


Jean-Marie
Azimut

Hors ligne

 

#58 Fri 03 September 2021 11:17

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 995

Re: SIRENE géocodée... infos et discussions

Sous Windows, vous pouvez installer et utiliser le sous-système Linux


En effet, on me l'a déjà conseillé, et je n'ai pas encore exploré ces possibilités.
J'espère trouver le temps !

En attendant, je m'en suis sorti en chargeant le CSV StockEtablissement_utf8_geo.csv dans QGis et en l'important dans ma base PostGreSQL via le Gestionnaire de BD de QGis.
Pas de problème de poids de fichiers cette fois, contraîrement à PSQL.

Par contre, Christian (ou quelqu'un d'autre qui a compris), peux-tu m'expliquer la différence entre les données disponibles dans ces 2 répertoires :
http://data.cquest.org/geo_sirene/last/
http://data.cquest.org/geo_sirene/v2019/last/

J'ai bien compris qu'il y avait un changement du format des fichier source en 2019, mais après je n'ai pas compris les différences de traitements entre ces 2 dossiers

Dernière modification par Sylvain M. (Fri 03 September 2021 11:17)


Sylvain M.

Hors ligne

 

#59 Fri 03 September 2021 12:26

cquest
Participant assidu
Date d'inscription: 6 Jan 2013
Messages: 872

Re: SIRENE géocodée... infos et discussions

v2019 contient les fichiers au format actuel, qui, entre autre, sépare unités légales et établissements et a tous les noms des champs modifiés (ou presque).

L'autre c'est une version  "retrosirene" que je recrée au plus proche pour ceux qui n'ont toujours pas basculé vers le nouveau format... mais le géocodage n'est fait qu'une fois sur v2019, réutilisé pour généré cette version legacy.


Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
A l'origine de opendatArchives, OpenEventDatabase

Hors ligne

 

#60 Fri 03 September 2021 12:45

Sylvain M.
Participant assidu
Lieu: Saint-Pierre-des-Nids (53)
Date d'inscription: 8 Sep 2005
Messages: 995

Re: SIRENE géocodée... infos et discussions

Merci pour ces précision Christian.
Encore une question, désolé (liée à mon inculture sur cette BDD) : est-il normal que les dénominations des entreprises / établissements ne soient pas dans le fichier, alors qu'ils s'affichent bien quand on fait une recherche avec le SIREN sur - par exemple - l'annuaire des Entreprises (https://annuaire-entreprises.data.gouv.fr/). Quel(s) fichier(s) dois-je récupérer pour avoir les dénominations ?


Sylvain M.

Hors ligne

 

Pied de page des forums

Powered by FluxBB