banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

Annonce

Printemps des cartes 2024

#1 Tue 27 October 2015 15:59

devnice
Participant occasionnel
Date d'inscription: 26 Jun 2012
Messages: 18

Extraction d'informations sur des documents LibreOffice vers Microsof

Bonjour à tous,

Je suis dans un projet d'extraction de documents (plus de 2000) LibreOffice (version 4.4.2) vers un tableur Excel ou un LibreOffice Calc. Le but étant d'insérer ces information ultérieurement dans une base de données PostgreSql et Postgis.
Les difficultés auxquelles je suis confrontées sont de deux ordres:

1) Dans les fichiers il y des cages à cocher et je voudrais n'extraire que les informations cochées,

2) Je voudrais aussi extraire du texte contenu entre deux titres par exemple.

Je ne sais pas s'il y a un programme qui permet d'aller chercher ces informations dans chaque fichier (boucle).

J'ai joins un exemple de fichier sur lequel les traitements seront effectués.

Je vous remercie de bien vouloir m'aider.

Dernière modification par devnice (Tue 27 October 2015 16:48)

Hors ligne

 

#2 Tue 27 October 2015 16:41

ThomasG
Membre
Lieu: Nantes
Date d'inscription: 9 Sep 2005
Messages: 943
Site web

Re: Extraction d'informations sur des documents LibreOffice vers Microsof

Bonjour,

Votre finalité est peut être d'exporter vers PostGIS vos documents mais cela ne relève pas vraiment de la géomatique ici. Je ne suis pas sûr que vous aurez beaucoup de réponses.

Néanmoins, vos possibilités peuvent être:

* d'enregistrer vos fichiers sous format XML donc manipulable avec n'importe quel langage de programmation et ensuite apprendre en lisant le XML comment extraire ce qui vous intéresse. La documentation du standard peut servir.

* de passer par les librairies pour développeurs mentionnées sur le site officiel OpenDocument. Cela devrait être plus simple que de manipuler du XML.

Dans tous les cas, je ne vous recommande pas d'extraire vos documents pour les mettre dans des fichiers type tableur mais de passer tout en base de données puis à partir de la base, de créer vos tableurs. En faisant cela, vous n'aurez pas à faire une extraction vers un tableur puis une extraction ultérieure vers la base: cela demandera plus de travail...
Ma réponse présuppose que vous savez utiliser un langage de programmation (à priori, vous allez devoir utiliser Python)

Cordialement

Thomas

PS: il n'y avait pas de document attaché...

Hors ligne

 

#3 Tue 27 October 2015 16:54

devnice
Participant occasionnel
Date d'inscription: 26 Jun 2012
Messages: 18

Re: Extraction d'informations sur des documents LibreOffice vers Microsof

Merci Thomas  pour votre réponse.

J'ai modifié le message et inséré le fichier d'exemple.

C'est vrai que cela relève plutôt de la programmation mais vu que la finalité sera cartographique je me suis permis de le publier ici.

Au fait j'ai essayer d'exporter les fichiers en XML  mais les informations cochées disparaissent ; je ne les vois pas dans les différentes balises.

Merci pour les suggestions et le lien. Je vais creuser du coté de python pour voir si c'est faisable.


Cordialement.

Hors ligne

 

Pied de page des forums

Powered by FluxBB