#1 Fri 04 November 2011 07:02
- pyjoubert
- Participant assidu
- Lieu: Lyon
- Date d'inscription: 21 Mar 2006
- Messages: 347
Nettoyge de contenu alphanumérique (ne pas prendre peur)
Bonjour,
Voici ci-dessous (Exemple1) le contenu d'une cellule Excel. Je voudrais nettoyer au mieux le conternu des cellules de ce genre. (Pour info, j'ai 15000 enregistrement de ce type). Toutes ne sont pas aussi compliquées, (voir Exemple 2) et ne contiennent qu'une ligne à extraire INTERPHONE, ANTENNE, PARKING AU PIED DE L'IMMEUBLE.
J'ai pensé tout d'abord à remplacer la chaine {\rtf1 ----- fs17 par rien, mais le résultat n'est pas probant et surtout difficile à écrire en Expresion régulière.
Auriez-vous une idée ?
Merci de votre aide
Exemple 1
{\rtf1\ansi\deff0\deftab720{\fonttbl{\f0\fswiss MS Sans Serif;}{\f1\froman\fcharset2 Symbol;}{\f2\fswiss Arial;}{\f3\fswiss Arial;}}
{\colortbl\red0\green0\blue0;}
\deflang1036\pard\plain\f3\fs17 NB. : Location facultative d'un parking couvert : 311 F par mois ;
\par . local annexe : cave - cellier ;
\par . vide-ordures et compteurs d'eaux individuels
\par . parties et \'e9quipements d'usage commun : ascenseur, local \'e0 v\'e9los,
\par . chauffage collectif par radiateurs.
\par }
Exemple 2
{\rtf1\ansi\deff0{\fonttbl{\f0\fswiss\fcharset0 Arial;}{\f1\fswiss Arial;}}
\viewkind4\uc1\pard\lang1036\f0\fs17 INTERPHONE, ANTENNE, PARKING AU PIED DE L'IMMEUBLE.\f1
\par }
Hors ligne
#2 Fri 04 November 2011 08:53
Re: Nettoyge de contenu alphanumérique (ne pas prendre peur)
Bonjour,
Je vois deux transformers qui pourraient t'être utile assez facilement
StringReplacer qui permet de rechercher une chaine et de la remplacer par ce que tu veux (rien est aussi une possibilité) Possibilité de passer par une expression régulière ou non.
AttributeSplitter qui te permet de couper la chaine grâce à un caractère précis. Ainsi, si par exemple tu demandes de couper lorsqu'il y a une virgule (,), tu auras les morceaux de l'exemple 2.
En combinant les deux transformers, tu devrais pouvoir t'en sortir.
Bonne chance et tient nous au courant.
Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com
Hors ligne