Pages: 1
- Sujet précédent - Extraction d'informations sur des documents LibreOffice vers Microsof - Sujet suivant
#1 Tue 27 October 2015 15:59
- devnice
- Participant occasionnel
- Date d'inscription: 26 Jun 2012
- Messages: 18
Extraction d'informations sur des documents LibreOffice vers Microsof
Bonjour à tous,
Je suis dans un projet d'extraction de documents (plus de 2000) LibreOffice (version 4.4.2) vers un tableur Excel ou un LibreOffice Calc. Le but étant d'insérer ces information ultérieurement dans une base de données PostgreSql et Postgis.
Les difficultés auxquelles je suis confrontées sont de deux ordres:
1) Dans les fichiers il y des cages à cocher et je voudrais n'extraire que les informations cochées,
2) Je voudrais aussi extraire du texte contenu entre deux titres par exemple.
Je ne sais pas s'il y a un programme qui permet d'aller chercher ces informations dans chaque fichier (boucle).
J'ai joins un exemple de fichier sur lequel les traitements seront effectués.
Je vous remercie de bien vouloir m'aider.
Dernière modification par devnice (Tue 27 October 2015 16:48)
Hors ligne
#2 Tue 27 October 2015 16:41
Re: Extraction d'informations sur des documents LibreOffice vers Microsof
Bonjour,
Votre finalité est peut être d'exporter vers PostGIS vos documents mais cela ne relève pas vraiment de la géomatique ici. Je ne suis pas sûr que vous aurez beaucoup de réponses.
Néanmoins, vos possibilités peuvent être:
* d'enregistrer vos fichiers sous format XML donc manipulable avec n'importe quel langage de programmation et ensuite apprendre en lisant le XML comment extraire ce qui vous intéresse. La documentation du standard peut servir.
* de passer par les librairies pour développeurs mentionnées sur le site officiel OpenDocument. Cela devrait être plus simple que de manipuler du XML.
Dans tous les cas, je ne vous recommande pas d'extraire vos documents pour les mettre dans des fichiers type tableur mais de passer tout en base de données puis à partir de la base, de créer vos tableurs. En faisant cela, vous n'aurez pas à faire une extraction vers un tableur puis une extraction ultérieure vers la base: cela demandera plus de travail...
Ma réponse présuppose que vous savez utiliser un langage de programmation (à priori, vous allez devoir utiliser Python)
Cordialement
Thomas
PS: il n'y avait pas de document attaché...
Hors ligne
#3 Tue 27 October 2015 16:54
- devnice
- Participant occasionnel
- Date d'inscription: 26 Jun 2012
- Messages: 18
Re: Extraction d'informations sur des documents LibreOffice vers Microsof
Merci Thomas pour votre réponse.
J'ai modifié le message et inséré le fichier d'exemple.
C'est vrai que cela relève plutôt de la programmation mais vu que la finalité sera cartographique je me suis permis de le publier ici.
Au fait j'ai essayer d'exporter les fichiers en XML mais les informations cochées disparaissent ; je ne les vois pas dans les différentes balises.
Merci pour les suggestions et le lien. Je vais creuser du coté de python pour voir si c'est faisable.
Cordialement.
Hors ligne
Pages: 1
- Sujet précédent - Extraction d'informations sur des documents LibreOffice vers Microsof - Sujet suivant