#1 Thu 25 May 2017 11:37
- linareja
- Juste Inscrit !
- Date d'inscription: 24 May 2017
- Messages: 1
Création compte pour télécharger données SIRENE
Bonjour a tou.te.s,
Je m'excuse d’abord pour mes fautes d’orthographe.
Je veux constituer une liste de données SIRENE (http://www.sirene.fr/sirene/public/creation-fichier) à télécharger mais j'arrive pas à créer un compte, il y a toujours une erreur à la fin.
Este ce que quelqu’un d'entre vous a eu le même problème?
Merci d'avance.
Lina
Lien:
http://www.sirene.fr/sirene/public/inscription-fichier
Hors ligne
#2 Fri 26 May 2017 07:56
- yopyop25
- Participant actif
- Lieu: besançon
- Date d'inscription: 2 Jun 2008
- Messages: 144
Re: Création compte pour télécharger données SIRENE
Bonjour,
La base SIRENE est téléchargeable ici https://www.data.gouv.fr/fr/datasets
Elle est en open data depuis cette année.
Vous pourrez reconstituer votre liste à partir du fichier complet. Attention, il existe un fichier complet et un fichier uniquement des mises à jour chaque mois.
Yohan
Hors ligne
#3 Mon 29 May 2017 09:16
- FPNO
- Participant actif
- Date d'inscription: 24 Oct 2013
- Messages: 145
Re: Création compte pour télécharger données SIRENE
Bonjour
Vous pouvez avoir également un découpage par département ici : http://212.47.238.202/geo_sirene/last/
Cordialement
Franck
Hors ligne
#4 Wed 05 July 2017 10:42
Re: Création compte pour télécharger données SIRENE
Salut,
je tente dimporter le fichier de la base SIRENE dans postgresql avec
SET client_encoding = 'LATIN1';
COPY sirene FROM '/var/sirc-17804_9075_14209_201705_L_M_20170601_024542286.csv' CSV HEADER delimiter ',' null '';
Mais j'ai un message d'erreur État SQL :42P01
Je suppose que c'est une histoire de \n et de \r qu'il faut supprimer mais comment faire ? Excel refuse d'ouvrir le fichier car trop gros (8 GO)
je souhaite tout prendre en compte et franchement le systeme de telechargement partiel sur le site n'est franchement pas pratique et très limitant
Merci d'avance
Hors ligne
#5 Wed 05 July 2017 11:36
Re: Création compte pour télécharger données SIRENE
Bonjour @owlapps
Notepadd++ risque de faire la tête également, peut être ultraedit et encore.
Sinon FME devrait s'en sortir sans trop de problème.
@+
Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com
Hors ligne
#6 Wed 05 July 2017 12:17
Re: Création compte pour télécharger données SIRENE
quand je telecharge partiellement avec http://212.47.238.202/geo_sirene/last/
je n'ai rien quand je décompresse le fichier (dep 94, 95), ca fait pareil chez vous ?
Hors ligne
#7 Wed 05 July 2017 12:26
- FranckG
- Participant actif
- Date d'inscription: 2 Apr 2010
- Messages: 104
Re: Création compte pour télécharger données SIRENE
ça marche bien chez moi, les deux fichiers sont OK.
Un problème avec 7zip ?
Hors ligne
#8 Wed 05 July 2017 12:40
Re: Création compte pour télécharger données SIRENE
ça marche bien chez moi, les deux fichiers sont OK.
Un problème avec 7zip ?
ca doit etre le decompresseur qui compresse trop...
finalement j'ai ouvert le fichier avec libreoffic calc, refait un import qui est lent très lent (dep 94), je vais retenter avec un fichier de qlqs lignes seulement pour voir
mais apparemment il ne s'agirait pas d'un probleme de \n et de \r plutot carrément un probleme de taille de fichier à importer dans postgresql !
je vais etudier la question d'un ETL comme talend
Hors ligne
#9 Wed 05 July 2017 13:35
Re: Création compte pour télécharger données SIRENE
Bonjour,
Ce sujet a été abordé ici : PostgreSQL : import et traitement d'un "gros" CSV
Franck
Hors ligne
#10 Thu 06 July 2017 09:29
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 898
Re: Création compte pour télécharger données SIRENE
Etonnant ces problèmes d'import de CSV dans postgres, je ne suis jamais tombé dessus (sous linux) pourtant je manipule des fichiers bien plus lourd qu'un extrait départemental de SIRENE.
Je n'utilise par contre pas COPY mais \COPY et indique l'encodage dans les options
\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Pour info, le stock au 1/7/2017 a été géocodé cette nuit et est dispo comme d'habitude sur http://212.47.238.202/geo_sirene/last
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#11 Wed 12 July 2017 16:48
Re: Création compte pour télécharger données SIRENE
\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Comment executez-vous votre code ?
Je tente de l'executer depuis l'éditeur de requêtes de pgadmin mais j'ai des retours d'erreurs ! :-/
Hors ligne
#12 Wed 12 July 2017 21:24
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 898
Re: Création compte pour télécharger données SIRENE
cquest a écrit:\COPY matable FROM monfichier WITH (format csv, header true, encoding 'iso8859-1', delimiter ';')
Comment executez-vous votre code ?
Je tente de l'executer depuis l'éditeur de requêtes de pgadmin mais j'ai des retours d'erreurs ! :-/
Je n'utilise pas pgAdmin, mais uniquement psql en ligne de commande... ce qui permet de scripter toutes les opérations pour que les traitement soient reproductibles de A à Z.
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#13 Mon 31 July 2017 10:04
Re: Création compte pour télécharger données SIRENE
bon, c'est surtout qu'il faut déjà que les champs soient présents dans la table de réception,
pour ceux que ca intéresse voilà la requête de création de la table pour Postgresql inspirée
par https://marmelab.com/blog/2017/01/09/si … t-sql.html :
Code:
CREATE TABLE entreprises (
SIREN character varying, -- Identifiant de l’entreprise
NIC character varying, -- Numéro interne de classement de l’établissement
L1_NORMALISEE character varying, -- Première ligne de l’adresse normalisée de l’établissement
L2_NORMALISEE character varying, -- Deuxième ligne de l’adresse normalisée de l’établissement
L3_NORMALISEE character varying, -- Troisième ligne de l’adresse normalisée de l’établissement
L4_NORMALISEE character varying, -- Quatrième ligne de l’adresse normalisée de l’établissement
L5_NORMALISEE character varying, -- Cinquième ligne de l’adresse normalisée de l’établissement
L6_NORMALISEE character varying, -- Sixième ligne de l’adresse normalisée de l’établissement
L7_NORMALISEE character varying, -- Septième ligne de l’adresse normalisée de l’établissement
L1_DECLAREE character varying, -- Première ligne de l’adresse déclarée de l’établissement
L2_DECLAREE character varying, -- Deuxième ligne de l’adresse déclarée de l’établissement
L3_DECLAREE character varying, -- Troisième ligne de l’adresse déclarée de l’établissement
L4_DECLAREE character varying, -- Quatrième ligne de l’adresse déclarée de l’établissement
L5_DECLAREE character varying, -- Cinquième ligne de l’adresse déclarée de l’établissement
L6_DECLAREE character varying, -- Sixième ligne de l’adresse déclarée de l’établissement
L7_DECLAREE character varying, -- Septième ligne de l’adresse déclarée de l’établissement
NUMVOIE character varying, -- Numéro dans la voie
INDREP character varying, -- Indice de répétition
TYPVOIE character varying, -- Type de la voie de localisation de l’établissement
LIBVOIE character varying, -- Libellé de la voie de localisation de l’établissement
CODPOS character varying, -- Code postal
CEDEX character varying, -- Code Cedex
RPET character varying, -- Région de localisation de l’établissement
LIBREG character varying, -- Libellé de la région
DEPET character varying, -- Département de localisation de l’établissement
ARRONET character varying, -- Arrondissement de localisation de l’établissement
CTONET character varying, -- Canton de localisation de l’établissement
COMET character varying, -- Commune de localisation de l’établissement
LIBCOM character varying, -- Libellé de la commune de localisation de l’établissement
DU character varying, -- Département de l’unité urbaine de la localisation de l’établissement
TU character varying, -- Taille de l’unité urbaine
UU character varying, -- Numéro de l’unité urbaine
EPCI character varying, -- Localisation de l’établissement dans un établissement public de coopération intercommunale
TCD character varying, -- Tranche de commune détaillée
ZEMET character varying , -- Zone d’emploi
SIEGE character varying , -- Qualité de siège ou non de l’établissement
ENSEIGNE character varying , -- Enseigne ou nom de l’exploitation
IND_PUBLIPO character varying , -- Indicateur du champ du publipostage
DIFFCOM character varying , -- Statut de diffusion de l’établissement
AMINTRET character varying , -- Année et mois d’introduction de l’établissement dans la base de diffusion
NATETAB character varying , -- Nature de l’établissement d’un entrepreneur individuel
LIBNATETAB character varying , -- Libellé de la nature de l’établissement d’un entrepreneur individuel
APET700 character varying , -- Activité principale de l’établissement
LIBAPET character varying , -- Libellé de l’activité principale de l’établissement
DAPET smallint, -- Année de validité de l’activité principale de l’établissement
TEFET character varying , -- Tranche d’effectif salarié de l’établissement
LIBTEFET character varying , -- Libellé de la tranche d’effectif salarié de l’établissement
EFETCENT character varying , -- Effectif salarié de l’établissement à la centaine près
DEFET smallint, -- Année de validité de l’effectif salarié de l’établissement
ORIGINE character varying , -- Origine de la création de l’établissement
DCRET character varying , -- Année et mois de création de l’établissement
DATE_DEB_ETAT_ADM_ET character varying , -- Date de début d’activité
ACTIVNAT character varying , -- Nature de l’activité de l’établissement
LIEUACT character varying , -- Lieu de l’activité de l’établissement
ACTISURF character varying , -- Type de magasin
SAISONAT character varying , -- Caractère saisonnier ou non de l’activité de l’établissement
MODET character varying , -- Modalité de l’activité principale de l’établissement
PRODET character varying , -- Caractère productif de l’établissement
PRODPART character varying , -- Participation particulière à la production de l’établissement
AUXILT smallint, -- Caractère auxiliaire de l’activité de l’établissement
NOMEN_LONG character varying , -- Nom ou raison sociale de l’entreprise
SIGLE character varying , -- Sigle de lentreprise
NOM character varying , -- Nom de naissance
PRENOM character varying , -- Prénom
CIVILITE character varying , -- Civilité des entrepreneurs individuels
RNA character varying , -- Numéro d’identification au répertoire national des associations
NICSIEGE character varying , -- Numéro interne de classement de l’établissement siège
RPEN character varying , -- Région de localisation du siège de l’entreprise
DEPCOMEN character varying , -- Département et commune de localisation du siège de l’entreprise
ADR_MAIL character varying , -- Adresse mail
NJ character varying , -- Nature juridique de l’entreprise
LIBNJ character varying , -- Libellé de la nature juridique
APEN700 character varying , -- Cope APE - Activité principale de l’entreprise
LIBAPEN character varying , -- Libellé de l’activité principale de l’entreprise
DAPEN smallint, -- Année de validité de l’activité principale de l’entreprise
APRM character varying , -- Activité principale au registre des métiers
ESSEN character varying , -- Appartenance au champ de l’économie sociale et solidaire
DATEESS character varying , -- Date ESS
TEFEN character varying , -- Tranche d’effectif salarié de l’entreprise
LIBTEFEN character varying , -- Libellé de la tranche d’effectif salarié de l’entreprise
EFENCENT character varying , -- Effectif salarié de l’entreprise à la centaine près
DEFEN smallint, -- Année de validité de l’effectif salarié de l’entreprise
CATEGORIE character varying , -- Catégorie de l’entreprise
DCREN character varying , -- Date de création de l’entreprise
AMINTREN character varying , -- Année et mois d’introduction de l’entreprise dans la base de diffusion
MONOACT character varying , -- Indice de monoactivité de l’entreprise
MODEN character varying , -- Modalité de l’activité principale de l’entreprise
PRODEN character varying , -- Caractère productif de l’entreprise
ESAANN smallint, -- Année de validité des rubriques de niveau entreprise en provenance de l’ESA
TCA character varying , -- Tranche de chiffre d’affaires pour les entreprises enquêtées par l’ESA
ESAAPEN character varying , -- Activité principale de l’entreprise issue de l’ESA
ESASEC1N character varying , -- Première activité secondaire déclarée dans l’ESA
ESASEC2N character varying , -- Deuxième activité secondaire déclarée dans l’ESA
ESASEC3N character varying , -- Troisième activité secondaire déclarée dans l’ESA
ESASEC4N character varying , -- Quatrième activité secondaire déclarée dans l’ESA
VMAJ character varying , -- Nature de la mise à jour (création, suppression, modification)
VMAJ1 smallint, -- Indicateur de mise à jour n°1
VMAJ2 smallint, -- Indicateur de mise à jour n°2
VMAJ3 smallint, -- Indicateur de mise à jour n°3
DATEMAJ date -- Date de traitement de la mise à jour
);Dernière modification par owlapps (Mon 31 July 2017 10:05)
Hors ligne
#14 Mon 31 July 2017 10:28
- ChristopheV
- Membre
- Lieu: Ajaccio
- Date d'inscription: 7 Sep 2005
- Messages: 3224
- Site web
Re: Création compte pour télécharger données SIRENE
Bonjour,
Je n'ai pas regardé le fichier SIREN depuis un moment mais utiliser "character varying" dans une "grosse" base de données c'est pas le top. Si les champs alphanum sont définis avec une longueur fixe il vaut mieux utiliser character varying(n).
Concernant l'intégration je préfère utiliser un peu de code (.net pour moi, mais python ou autre ça le fait) pour lire le fichier ligne à ligne et vérifier le formatage, les caractères à la c*** etc ... car il n'y a rien de plus "pourrissable" qu'un fichier texte.
Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close
Hors ligne
#16 Mon 31 July 2017 11:54
- ChristopheV
- Membre
- Lieu: Ajaccio
- Date d'inscription: 7 Sep 2005
- Messages: 3224
- Site web
Re: Création compte pour télécharger données SIRENE
Bonjour,
En fait "n" est défini par le producteur de donnés et il varie en fonction du champs.
Par exemple pour les données MAJIC cela donne quelque chose comme cela :
Code:
CREATE TABLE IF NOT EXISTS majic2016.surface ( idsurface serial, ptrparcelle integer, ptrlot integer, contenance integer, groupe character varying(2), sousgroupe character varying(2), groupeclasse character varying(2), culture character varying(5), numpdl character varying(3), numlot character varying(7), lettre character varying(2) ) WITH ( OIDS=FALSE ); ALTER TABLE majic2016.surface OWNER TO postgres;
Christophe
L'avantage d'être une île c'est d'être une terre topologiquement close
Hors ligne
#18 Mon 31 July 2017 16:05
- Pierre
- DesCartesPourUnMondeMeilleur
- Date d'inscription: 22 Sep 2005
- Messages: 1643
Re: Création compte pour télécharger données SIRENE
Aloha,
je n'ai pas vraiment regardé en profondeur la base, est-ce que les centres commerciaux y sont présents ?
Dans le code NAF, on trouve, entre autres :
"47.11B";"Commerce d'alimentation générale"
"47.11C";"Supérettes"
"47.11D";"Supermarchés"
"47.11E";"Magasins multi-commerces"
"47.11F";"Hypermarchés"
"47.19A";"Grands magasins"
"47.19B";"Autres commerces de détail en magasin non spécialisé"
Donc, oui. Ils sont présents.
art X I. Déclaration des Droits de l’Homme et du Citoyen 1789
La libre communication des pensées et des opinions est un des droits les plus précieux de l’Homme : tout Citoyen peut donc parler, écrire, imprimer librement, sauf à répondre de l’abus de cette liberté, dans les cas déterminés par la Loi.
Hors ligne
#19 Wed 02 August 2017 15:40
Re: Création compte pour télécharger données SIRENE
cest ce que je pensais, on peut le faire qu'indirectement.
Il me semble que les retail parks sont des centres commerciaux n'incluant pas de locomotive alimentaire (super ou hypermarché)
Hors ligne
#20 Wed 02 August 2017 16:11
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 898
Re: Création compte pour télécharger données SIRENE
cest ce que je pensais, on peut le faire qu'indirectement.
Il me semble que les retail parks sont des centres commerciaux n'incluant pas de locomotive alimentaire (super ou hypermarché)
La limite est de toute façon le fait qu'il y ait une structure juridique propre et qu'elle soit enregistrée dans la base SIRENE.
Ce n'est pas forcément le cas pour 100% des "centres commerciaux" et le code APE n'est pas être pas des plus explicite/adapté.
J'explore en ce moment la réutilisation de SIRENE pour avoir une base de POI et permettre un géocodage sans adresse postale... ce n'est pas toujours aussi simple qu'on voudrait ![]()
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne
#22 Thu 03 August 2017 23:58
- cquest
- Participant assidu
- Date d'inscription: 6 Jan 2013
- Messages: 898
Re: Création compte pour télécharger données SIRENE
C'est possible d'avoir à ce stade un avant goût de la typologie (et sous-typologie ?) des POIs que vous allez mettre en OPENDATA ?
J'ai écrit un petit article sur medium.com à ce sujet... https://medium.com/@cq94/g%C3%A9ocodage … 028761b739
Christian Quest - https://amicale.net/@cquest sur Mastodon (terminé twitter/X)
Membre fondateur et porte parole d'OpenStreetMap France
Initiateur de opendatArchives, OpenEventDatabase, Panoramax
Hors ligne


