Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considèrerons que vous acceptez l'utilisation des cookies. J'ai compris ! ou En savoir plus !.
banniere

Le portail francophone de la géomatique


Toujours pas inscrit ? Mot de passe oublié ?
Nom d'utilisateur    Mot de passe              Toujours pas inscrit ?   Mot de passe oublié ?

Annonce

GEODATA DAYS 2024

#1 Tue 30 April 2013 15:17

MagBar
Participant assidu
Date d'inscription: 27 Jun 2012
Messages: 203

AU SECOUR : Traitement données Lourdes

Je reviens à la charge pour mon problème de traitement lourd - très lourd - très très lourd.....

Il semble d'après les échanges que j'ai eu avec Veremes et sur ce forum, que le problème ne viens pas des capacités de ma machines mais de mon projet.
Hord mon projet fonctionne convenablement avec d'autres sources. Donc, j'en déduit que cette sources très lourdes est responsable de cette lenteeeeeuuuuuurrrrrrr...:s

Voilà les symptomes :
Le projet fonctionne convenablement, dans des délais raisonnables compte tenu de la lourdeur des sources, jusque mi-parcours ou il deviens de plus en plus lent... Jusque n'en plus finir (j'ai tenu plus de 2 semaines une fois avant de l'arrêter).

Je tente d'utiliser le système de traitement parallèles, toutefois, je n'ai "que" 12 coeurs (et je fais des regroupements par "regions francaise" ou pour encore plus d'allègement par département donc jusqu'une centaines de groupes :s (pour mes tests actuels j'en ai beaucoup moins car je ne traite pas toutes les données sources (et malgré celà je n'arrive pas à terme)..
Ma licence ne me permets par ailleurs que 8 traitements parallèles (à voir si on augmente la licence si celà aiderai considérablement ???)

la lecture des sources prends à elle seule 1h... les contrôles et analyses BDD et format prends environs 9h (ce qui est encore envisageable).. Par contre les étapes suivantes qui contiens en particulier 2 dissolvers (par groupes-le 1er etant très long, le second redissous le 1er donc bcp moin lonf mais nécessaire pour mes comparatifs geometrique entre mon resultat en cours et une autre source) et quelques clippers (avec et sans regroupement), les écriture Excel de toutes les analyses précédentes et 1 buffer et 1 generalizer.

J'utilise le paramètre "parallélisme" à Minimal car avec 12 coeur si j'augmente, je dépasse l'autorisation de ma licence.

Je pense à mettre en plce des sous Projets
- Analyses
- Modifications format
- comparatifs géometrique
etc....

afin de ne pas couper le projet entier si j'ai le moindre beug (comme il m'est arrivé : redémarrage machine :s)

Est ce que celà pourrait accélerer les processus ? Dans ce cas qui pourrait m'expliquer comment lancer automatiquement ces sous projets sachant qu'il y a des paramètres qui sont lié entre un projet et un autre :s

Mon disque qui reçois les fichiers temporaires est assez gros (698 Go), ce n'est pas un SSD. J'ignore s'il est rapide en écriture.
J'ai également 50Go de RAM.

Les sources sont lourdes (environs 7Go - celà pourrait augmenter encore) avec de nombreux vertex (d'ou le dissolver et le Generalizer)
et sont organisés dans plusieurs dossiers et sous dossiers. (4 dossiers contenant environs 6 dossiers chacuns contenant environs  6 dossiers chacuns contenant eux même 300-500 dossiers chacuns qui contiennent des shapes shp dbf prj shx)

une idée de votre côté pour accélerer ce projet afin qu'il ne dépasse pas 2-3 jours ????

croisant les doigts pour qu'un éclair de Génie vous touche smile ou me touche entre temps (j'y crois moins :s) et dans l'attente de votre retour.

Hors ligne

 

#2 Tue 30 April 2013 16:20

Loic_GR
Moderateur
Lieu: Besancon
Date d'inscription: 12 May 2011
Messages: 1022
Site web

Re: AU SECOUR : Traitement données Lourdes

2 semaines ! Sympa big_smile

Essaye d'optimiser le projet, regarde s'il n'y a pas des méthodes moins gourmandes, des redondances...

Autre idée, ne serait-il pas intéressant de tout rentrer dans un postgis, indexer puis faire la moulinette ?


Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com

Hors ligne

 

#3 Tue 30 April 2013 16:30

MagBar
Participant assidu
Date d'inscription: 27 Jun 2012
Messages: 203

Re: AU SECOUR : Traitement données Lourdes

oui pas glop. En plus là tu me parle chinois lol qu'est ce qu'un postgis ? lol

Je tente de l'potimiser au plus, mais j'ai des étapes indispensables. Et comme je le souligne avec d'autres sources, tous fonctionne. J'ai regarder un peu les posts de ce forum plus ou moins ancien, et j'ai pu voir que ce problème est arrivé à d'autres (dans d'autres  traitement certes) mais toujours avec des Sources lourdes. Je n'ai toutefois pas vu ou pas compris les solutions apportés :s

Dans les logs, on voit la mention de mémoire limité selon licence, mémoire "pic" et "moyenne" utilisé pour le traitement. Est ce que celà à un impact ?

Malheureusement je ne comprends pas bien les Log qui aurait peut être pus m'éclairer. Le dissolver semble séparé en "tileé et sous process..

Hors ligne

 

#4 Tue 30 April 2013 16:41

Loic_GR
Moderateur
Lieu: Besancon
Date d'inscription: 12 May 2011
Messages: 1022
Site web

Re: AU SECOUR : Traitement données Lourdes

A quel moment dans les logs, le processus s'arrête ou avance doucement ? Souvent, ça bloque à un joiner ou un spatialfilter...

Postgis, c'est une solution libre pour sotcker des informations géographiques. C'est le cartouche de géographique PostgreSQL (système de gestion de base de données relationnelle).

https://fr.wikipedia.org/wiki/PostgreSQL


Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com

Hors ligne

 

#5 Tue 30 April 2013 16:49

Robin
GeoRezo forever
Lieu: France
Date d'inscription: 31 Aug 2005
Messages: 13614
Site web

Re: AU SECOUR : Traitement données Lourdes

je n'ai "que" 12 coeurs [...] J'ai également 50Go de RAM.


yikes Diantre !

Hors ligne

 

#6 Tue 30 April 2013 16:56

Loic_GR
Moderateur
Lieu: Besancon
Date d'inscription: 12 May 2011
Messages: 1022
Site web

Re: AU SECOUR : Traitement données Lourdes

Robin a écrit:

je n'ai "que" 12 coeurs [...] J'ai également 50Go de RAM.


yikes Diantre !


J'espère au moins qu'il est sur une plateforme 64 bits... big_smile

Avec ça, tu peux jouer à "qui qui a la plus grosse"...

J'ai (qu')un quadcore et 12 go de ram pour ma part...

Dernière modification par heretik25 (Tue 30 April 2013 16:57)


Freelance traitements ETL FME certifié: www.sitdi-france.fr Twitter : @sitdifrance
Site perso ~ www.partir-en-vtt.com

Hors ligne

 

#7 Thu 02 May 2013 08:03

MagBar
Participant assidu
Date d'inscription: 27 Jun 2012
Messages: 203

Re: AU SECOUR : Traitement données Lourdes

lol oui je suis sur un 64bits lol et c'est moi qu'est la plus grosse wink (sur mon site en tout cas lol)
mais ça me fait pas avancer le shmililiblick .....
je bloque parfois au dissolver et parfois au clipper après generalizer sans vraiment de raison. J'ai regardé côté fichiers temporaires si ça faisait pas exploser mon DD mais ce n'est pas le cas. et plus j'avance dans le process plus ça ralentis.
Je vais tenter de fractionner le process en plusieurs ça devrait mieux passer.
Le dissolver hors Process prends 4-5h et dans le process il peut prendre 2 jours ou être interminable :s

Hors ligne

 

Pied de page des forums

Powered by FluxBB