#1 Thu 25 May 2017 11:37
- linareja
- Juste Inscrit !
- Date d'inscription: 24 May 2017
- Messages: 1
Création compte pour télécharger données SIRENE
Bonjour a tou.te.s,
Je m'excuse d’abord pour mes fautes d’orthographe.
Je veux constituer une liste de données SIRENE (http://www.sirene.fr/sirene/public/creation-fichier) à télécharger mais j'arrive pas à créer un compte, il y a toujours une erreur à la fin.
Este ce que quelqu’un d'entre vous a eu le même problème?
Merci d'avance.
Lina
Lien:
http://www.sirene.fr/sirene/public/inscription-fichier
Hors ligne
#2 Fri 26 May 2017 07:56
- yopyop25
- Participant actif
- Lieu: besançon
- Date d'inscription: 2 Jun 2008
- Messages: 144
Re: Création compte pour télécharger données SIRENE
Bonjour,
La base SIRENE est téléchargeable ici https://www.data.gouv.fr/fr/datasets
Elle est en open data depuis cette année.
Vous pourrez reconstituer votre liste à partir du fichier complet. Attention, il existe un fichier complet et un fichier uniquement des mises à jour chaque mois.
Yohan
Hors ligne
#3 Mon 29 May 2017 09:16
- FPNO
- Participant actif
- Date d'inscription: 24 Oct 2013
- Messages: 141
Re: Création compte pour télécharger données SIRENE
Bonjour
Vous pouvez avoir également un découpage par département ici : http://212.47.238.202/geo_sirene/last/
Cordialement
Franck
Hors ligne
#4 Wed 05 July 2017 10:42
Re: Création compte pour télécharger données SIRENE
Salut,
je tente dimporter le fichier de la base SIRENE dans postgresql avec
SET client_encoding = 'LATIN1';
COPY sirene FROM '/var/sirc-17804_9075_14209_201705_L_M_20170601_024542286.csv' CSV HEADER delimiter ',' null '';
Mais j'ai un message d'erreur État SQL :42P01
Je suppose que c'est une histoire de \n et de \r qu'il faut supprimer mais comment faire ? Excel refuse d'ouvrir le fichier car trop gros (8 GO)
je souhaite tout prendre en compte et franchement le systeme de telechargement partiel sur le site n'est franchement pas pratique et très limitant
Merci d'avance
Hors ligne
#5 Wed 05 July 2017 11:36
Re: Création compte pour télécharger données SIRENE
Bonjour @owlapps
Notepadd++ risque de faire la tête également, peut être ultraedit et encore.
Sinon FME devrait s'en sortir sans trop de problème.
@+
Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com
Hors ligne
#6 Wed 05 July 2017 12:17
Re: Création compte pour télécharger données SIRENE
quand je telecharge partiellement avec http://212.47.238.202/geo_sirene/last/
je n'ai rien quand je décompresse le fichier (dep 94, 95), ca fait pareil chez vous ?
Hors ligne
#7 Wed 05 July 2017 12:26
- FranckG
- Participant actif
- Date d'inscription: 2 Apr 2010
- Messages: 104
Re: Création compte pour télécharger données SIRENE
ça marche bien chez moi, les deux fichiers sont OK.
Un problème avec 7zip ?
Hors ligne
#8 Wed 05 July 2017 12:40
Re: Création compte pour télécharger données SIRENE
ça marche bien chez moi, les deux fichiers sont OK.
Un problème avec 7zip ?
ca doit etre le decompresseur qui compresse trop...
finalement j'ai ouvert le fichier avec libreoffic calc, refait un import qui est lent très lent (dep 94), je vais retenter avec un fichier de qlqs lignes seulement pour voir
mais apparemment il ne s'agirait pas d'un probleme de \n et de \r plutot carrément un probleme de taille de fichier à importer dans postgresql !
je vais etudier la question d'un ETL comme talend
Hors ligne
#9 Wed 05 July 2017 13:35
Re: Création compte pour télécharger données SIRENE
Bonjour,
Ce sujet a été abordé ici : PostgreSQL : import et traitement d'un "gros" CSV
Franck
Hors ligne
#10 Thu 06 July 2017 09:29
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 874
Re: Création compte pour télécharger données SIRENE
Etonnant ces problèmes d'import de CSV dans postgres, je ne suis jamais tombé dessus (sous linux) pourtant je manipule des fichiers bien plus lourd qu'un extrait départemental de SIRENE.
Je n'utilise par contre pas COPY mais \COPY et indique l'encodage dans les options
\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Pour info, le stock au 1/7/2017 a été géocodé cette nuit et est dispo comme d'habitude sur http://212.47.238.202/geo_sirene/last
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#11 Wed 12 July 2017 16:48
Re: Création compte pour télécharger données SIRENE
\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Comment executez-vous votre code ?
Je tente de l'executer depuis l'éditeur de requêtes de pgadmin mais j'ai des retours d'erreurs ! :-/
Hors ligne
#12 Wed 12 July 2017 21:24
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 874
Re: Création compte pour télécharger données SIRENE
cquest a écrit:\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Comment executez-vous votre code ?
Je tente de l'executer depuis l'éditeur de requêtes de pgadmin mais j'ai des retours d'erreurs ! :-/
Je n'utilise pas pgAdmin, mais uniquement psql en ligne de commande... ce qui permet de scripter toutes les opérations pour que les traitement soient reproductibles de A à Z.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#13 Mon 31 July 2017 10:04
Re: Création compte pour télécharger données SIRENE
bon, c'est surtout qu'il faut déjà que les champs soient présents dans la table de réception,
pour ceux que ca intéresse voilà la requête de création de la table pour Postgresql inspirée
par https://marmelab.com/blog/2017/01/09/si … t-sql.html :
Code:
CREATE TABLE entreprises ( SIREN character varying, -- Identifiant de l’entreprise NIC character varying, -- Numéro interne de classement de l’établissement L1_NORMALISEE character varying, -- Première ligne de l’adresse normalisée de l’établissement L2_NORMALISEE character varying, -- Deuxième ligne de l’adresse normalisée de l’établissement L3_NORMALISEE character varying, -- Troisième ligne de l’adresse normalisée de l’établissement L4_NORMALISEE character varying, -- Quatrième ligne de l’adresse normalisée de l’établissement L5_NORMALISEE character varying, -- Cinquième ligne de l’adresse normalisée de l’établissement L6_NORMALISEE character varying, -- Sixième ligne de l’adresse normalisée de l’établissement L7_NORMALISEE character varying, -- Septième ligne de l’adresse normalisée de l’établissement L1_DECLAREE character varying, -- Première ligne de l’adresse déclarée de l’établissement L2_DECLAREE character varying, -- Deuxième ligne de l’adresse déclarée de l’établissement L3_DECLAREE character varying, -- Troisième ligne de l’adresse déclarée de l’établissement L4_DECLAREE character varying, -- Quatrième ligne de l’adresse déclarée de l’établissement L5_DECLAREE character varying, -- Cinquième ligne de l’adresse déclarée de l’établissement L6_DECLAREE character varying, -- Sixième ligne de l’adresse déclarée de l’établissement L7_DECLAREE character varying, -- Septième ligne de l’adresse déclarée de l’établissement NUMVOIE character varying, -- Numéro dans la voie INDREP character varying, -- Indice de répétition TYPVOIE character varying, -- Type de la voie de localisation de l’établissement LIBVOIE character varying, -- Libellé de la voie de localisation de l’établissement CODPOS character varying, -- Code postal CEDEX character varying, -- Code Cedex RPET character varying, -- Région de localisation de l’établissement LIBREG character varying, -- Libellé de la région DEPET character varying, -- Département de localisation de l’établissement ARRONET character varying, -- Arrondissement de localisation de l’établissement CTONET character varying, -- Canton de localisation de l’établissement COMET character varying, -- Commune de localisation de l’établissement LIBCOM character varying, -- Libellé de la commune de localisation de l’établissement DU character varying, -- Département de l’unité urbaine de la localisation de l’établissement TU character varying, -- Taille de l’unité urbaine UU character varying, -- Numéro de l’unité urbaine EPCI character varying, -- Localisation de l’établissement dans un établissement public de coopération intercommunale TCD character varying, -- Tranche de commune détaillée ZEMET character varying , -- Zone d’emploi SIEGE character varying , -- Qualité de siège ou non de l’établissement ENSEIGNE character varying , -- Enseigne ou nom de l’exploitation IND_PUBLIPO character varying , -- Indicateur du champ du publipostage DIFFCOM character varying , -- Statut de diffusion de l’établissement AMINTRET character varying , -- Année et mois d’introduction de l’établissement dans la base de diffusion NATETAB character varying , -- Nature de l’établissement d’un entrepreneur individuel LIBNATETAB character varying , -- Libellé de la nature de l’établissement d’un entrepreneur individuel APET700 character varying , -- Activité principale de l’établissement LIBAPET character varying , -- Libellé de l’activité principale de l’établissement DAPET smallint, -- Année de validité de l’activité principale de l’établissement TEFET character varying , -- Tranche d’effectif salarié de l’établissement LIBTEFET character varying , -- Libellé de la tranche d’effectif salarié de l’établissement EFETCENT character varying , -- Effectif salarié de l’établissement à la centaine près DEFET smallint, -- Année de validité de l’effectif salarié de l’établissement ORIGINE character varying , -- Origine de la création de l’établissement DCRET character varying , -- Année et mois de création de l’établissement DATE_DEB_ETAT_ADM_ET character varying , -- Date de début d’activité ACTIVNAT character varying , -- Nature de l’activité de l’établissement LIEUACT character varying , -- Lieu de l’activité de l’établissement ACTISURF character varying , -- Type de magasin SAISONAT character varying , -- Caractère saisonnier ou non de l’activité de l’établissement MODET character varying , -- Modalité de l’activité principale de l’établissement PRODET character varying , -- Caractère productif de l’établissement PRODPART character varying , -- Participation particulière à la production de l’établissement AUXILT smallint, -- Caractère auxiliaire de l’activité de l’établissement NOMEN_LONG character varying , -- Nom ou raison sociale de l’entreprise SIGLE character varying , -- Sigle de lentreprise NOM character varying , -- Nom de naissance PRENOM character varying , -- Prénom CIVILITE character varying , -- Civilité des entrepreneurs individuels RNA character varying , -- Numéro d’identification au répertoire national des associations NICSIEGE character varying , -- Numéro interne de classement de l’établissement siège RPEN character varying , -- Région de localisation du siège de l’entreprise DEPCOMEN character varying , -- Département et commune de localisation du siège de l’entreprise ADR_MAIL character varying , -- Adresse mail NJ character varying , -- Nature juridique de l’entreprise LIBNJ character varying , -- Libellé de la nature juridique APEN700 character varying , -- Cope APE - Activité principale de l’entreprise LIBAPEN character varying , -- Libellé de l’activité principale de l’entreprise DAPEN smallint, -- Année de validité de l’activité principale de l’entreprise APRM character varying , -- Activité principale au registre des métiers ESSEN character varying , -- Appartenance au champ de l’économie sociale et solidaire DATEESS character varying , -- Date ESS TEFEN character varying , -- Tranche d’effectif salarié de l’entreprise LIBTEFEN character varying , -- Libellé de la tranche d’effectif salarié de l’entreprise EFENCENT character varying , -- Effectif salarié de l’entreprise à la centaine près DEFEN smallint, -- Année de validité de l’effectif salarié de l’entreprise CATEGORIE character varying , -- Catégorie de l’entreprise DCREN character varying , -- Date de création de l’entreprise AMINTREN character varying , -- Année et mois d’introduction de l’entreprise dans la base de diffusion MONOACT character varying , -- Indice de monoactivité de l’entreprise MODEN character varying , -- Modalité de l’activité principale de l’entreprise PRODEN character varying , -- Caractère productif de l’entreprise ESAANN smallint, -- Année de validité des rubriques de niveau entreprise en provenance de l’ESA TCA character varying , -- Tranche de chiffre d’affaires pour les entreprises enquêtées par l’ESA ESAAPEN character varying , -- Activité principale de l’entreprise issue de l’ESA ESASEC1N character varying , -- Première activité secondaire déclarée dans l’ESA ESASEC2N character varying , -- Deuxième activité secondaire déclarée dans l’ESA ESASEC3N character varying , -- Troisième activité secondaire déclarée dans l’ESA ESASEC4N character varying , -- Quatrième activité secondaire déclarée dans l’ESA VMAJ character varying , -- Nature de la mise à jour (création, suppression, modification) VMAJ1 smallint, -- Indicateur de mise à jour n°1 VMAJ2 smallint, -- Indicateur de mise à jour n°2 VMAJ3 smallint, -- Indicateur de mise à jour n°3 DATEMAJ date -- Date de traitement de la mise à jour );
Dernière modification par owlapps (Mon 31 July 2017 10:05)
Hors ligne
#14 Mon 31 July 2017 10:28
- ChristopheV
- Membre
- Lieu: Ajaccio
- Date d'inscription: 7 Sep 2005
- Messages: 3197
- Site web
Re: Création compte pour télécharger données SIRENE
Bonjour,
Je n'ai pas regardé le fichier SIREN depuis un moment mais utiliser "character varying" dans une "grosse" base de données c'est pas le top. Si les champs alphanum sont définis avec une longueur fixe il vaut mieux utiliser character varying(n).
Concernant l'intégration je préfère utiliser un peu de code (.net pour moi, mais python ou autre ça le fait) pour lire le fichier ligne à ligne et vérifier le formatage, les caractères à la c*** etc ... car il n'y a rien de plus "pourrissable" qu'un fichier texte.
Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close
Hors ligne
#16 Mon 31 July 2017 11:54
- ChristopheV
- Membre
- Lieu: Ajaccio
- Date d'inscription: 7 Sep 2005
- Messages: 3197
- Site web
Re: Création compte pour télécharger données SIRENE
Bonjour,
En fait "n" est défini par le producteur de donnés et il varie en fonction du champs.
Par exemple pour les données MAJIC cela donne quelque chose comme cela :
Code:
CREATE TABLE IF NOT EXISTS majic2016.surface ( idsurface serial, ptrparcelle integer, ptrlot integer, contenance integer, groupe character varying(2), sousgroupe character varying(2), groupeclasse character varying(2), culture character varying(5), numpdl character varying(3), numlot character varying(7), lettre character varying(2) ) WITH ( OIDS=FALSE ); ALTER TABLE majic2016.surface OWNER TO postgres;
Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close
Hors ligne
#18 Mon 31 July 2017 16:05
- Pierre
- DesCartesPourUnMondeMeilleur
- Date d'inscription: 22 Sep 2005
- Messages: 1643
Re: Création compte pour télécharger données SIRENE
Aloha,
je n'ai pas vraiment regardé en profondeur la base, est-ce que les centres commerciaux y sont présents ?
Dans le code NAF, on trouve, entre autres :
"47.11B";"Commerce d'alimentation générale"
"47.11C";"Supérettes"
"47.11D";"Supermarchés"
"47.11E";"Magasins multi-commerces"
"47.11F";"Hypermarchés"
"47.19A";"Grands magasins"
"47.19B";"Autres commerces de détail en magasin non spécialisé"
Donc, oui. Ils sont présents.
art X I. Déclaration des Droits de l’Homme et du Citoyen 1789
La libre communication des pensées et des opinions est un des droits les plus précieux de l’Homme : tout Citoyen peut donc parler, écrire, imprimer librement, sauf à répondre de l’abus de cette liberté, dans les cas déterminés par la Loi.
Hors ligne
#19 Wed 02 August 2017 15:40
Re: Création compte pour télécharger données SIRENE
cest ce que je pensais, on peut le faire qu'indirectement.
Il me semble que les retail parks sont des centres commerciaux n'incluant pas de locomotive alimentaire (super ou hypermarché)
Hors ligne
#20 Wed 02 August 2017 16:11
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 874
Re: Création compte pour télécharger données SIRENE
cest ce que je pensais, on peut le faire qu'indirectement.
Il me semble que les retail parks sont des centres commerciaux n'incluant pas de locomotive alimentaire (super ou hypermarché)
La limite est de toute façon le fait qu'il y ait une structure juridique propre et qu'elle soit enregistrée dans la base SIRENE.
Ce n'est pas forcément le cas pour 100% des "centres commerciaux" et le code APE n'est pas être pas des plus explicite/adapté.
J'explore en ce moment la réutilisation de SIRENE pour avoir une base de POI et permettre un géocodage sans adresse postale... ce n'est pas toujours aussi simple qu'on voudrait
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#22 Thu 03 August 2017 23:58
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 874
Re: Création compte pour télécharger données SIRENE
C'est possible d'avoir à ce stade un avant goût de la typologie (et sous-typologie ?) des POIs que vous allez mettre en OPENDATA ?
J'ai écrit un petit article sur medium.com à ce sujet... https://medium.com/@cq94/g%C3%A9ocodage … 028761b739
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne