Draft of the scientific programm

Un article de lcgwiki.
Revision as of 10:38, 9 février 2007 by Pgirard (talk | contribs) (<span style="color:#FF0000;"> Gestion et exploitation des grilles de calcul)
Jump to: navigation, search

D.P. 31/01/2007

Objectifs

LCG-France organise son 2ème colloque à Clermont-Ferrand les 14 et 15 mars 2007. Ces journées sont destinées à tous les acteurs de la grille de calcul au LHC (gestionnaires de site et utilisateurs) de l'IN2P3 et du Dapnia. Elles ont pour objectifs d’offrir un lieu d’échange et de communication sur les actions, les idées et les expériences en cours dans la mise en place du calcul pour le LHC dans le cadre du projet LCG.


Programme Scientifique version 1 (7/12/06)

14 mars matin (3h) 9h30-11h 11H30-13h pause 11h-11h30

9h30-9h35 Welcome

Etat des lieux pour le calcul au LHC en France

Coordination : Ghita Rahal,CC-IN2P3; Dominique Pallin, LPC-Clermont

  • 09:35-09:45 -Infrastructure globale de grille en France et ressources associées F Malek
  • 09:45-10:00 -Présentation des sites (T1 et sites associés) D Boutigny
  • 10:00-10:20 -Présentation des sites (T2 etT3, T2 étrangers associés) F Chollet
  • 10:20-10:40 -mise en place de La grille francaise: F Hernandez
      • Les difficultés rencontrées;
      • adéquation modèles de calcul - infrastructure/ressources (du point de vue des sites)
      • Son évolution en vue des données LHC 2009-2010
  • 10:40-11:00 & 11h30-13:00 -Présentation de l'état du calcul dans les expériences:
      • Les modèles de calcul des expériences (overview)
      • Quelle participation dans la mise en place du calcul (en france)?
      • Adéquation entre les infrastructures/ressources et les besoins.
      • Etat de la production des données de simulation
      • Etat d'avancement par rapport à l'objectif de la prise de données de fin 2007.
      • Difficultés, les points à améliorer…
  • 10:40-11:00 -ALICE Y schutz
  • 11:00-11h30 ----------------- Pause ---------------------------
  • 11:30-11:50 -ATLAS E Lancon
  • 11:50-12:10 -CMS C Charlot ?
  • 12:10-12:30 -LHCb A Tsaregorodtsev ?
  • 12:30-13:00 -discussion/tour de table sur l'ensemble de la session
      • la grille francaise, sa mise en place et son utilisation, Du point de vue des sites, des collaborations LHC et des utilisateurs


14 mars après-midi (3h) 14h45-16h15 16H45-18h15 pause 16h15-16h45

Gestion et exploitation des grilles de calcul

Couvrir 2 aspects complémentaires :

-les actions des sites -> les conséquences au niveau des utilisateurs

-les actions des utilisateurs -> les conséquences au niveau des sites

Coordination : Christine Leroy, Dapnia-Saclay; Pierre Girard, Ingénieur, CC-IN2P3

  • le fonctionnement d'un site de la grille :

du déploiement du middleware à la gestion de sa production, en passant par les procédures qu'il doit suivre, comme la déclaration de "scheduled downtime", l'utilisation des outils officiels de monitoring (SAM, GSTAT, etc) et leurs conséquences (disparition partielle ou complète de la production, etc), sécurité,etc.

  • la gestion de jobs grilles :

de la façon dont ils sont soumis par les utilisateurs à la façon dont ils sont traités par les sites (dont la mise au point des formules de rank pour l'élection d'un site de soumission, le manque d'attractivité d'un site pour les jobs ou l'inverse, la gestion des priorités sur les jobs, des jobs pilotes, exécuteurs, etc.)


I- Sous-session "Gestion des jobs grille"

Dans cette première sous-session, il est demandé à chaque VO d'apporter des clarifications concernant les points suivants :

  1. Méthode(s) de distribution des jobs sur les sites :
    • utilisation ou non d'un RB ?
    • utilisation ou non des informations publiées ?
    • Critère d'élection d'un site ? etc.
  2. Organisation de la production
    • qui fait quoi, qui soumet quoi, les rôles, les histoires de priorité...
    • une production française ou pas
    • Système de monitoring pour les jobs ? Si oui, utilisable ou pas par les sites ? Quel est son principe de fonctionnement, etc.
    • gestion des proxy
    • Méthode d'installation des softs (+ desinstallation)
    • comment un nouvel OS est validé et l'information transmise
  3. Amélioration attendue et perspectives pour la gestion des jobs

 14:45 Introduction (5')
 14:50 Alice (10', Artem ?)
 15:00 Atlas (10', Stéphane ? Karim ?)
 15:10 Cms (10', Claude ? Artem ?)
 15:20 Lhcb (10', Andrei ou Sabine?)
 15:30 Discussions (45')


II- Sous-Session "Fonctionnement des sites"


16:45 "Exploitation globale de la grille" (30', Hélène C.)


les outils d'exploitation (GOC DB, SAM, GSTAT, MonALISA et le CIC Portal)

L'accounting

-Comment mesurer l’efficacite d’un site (utilisationCPU/CPU; resource disponible/resource indisponible ;jobs plantes/ jobs/reussis)


17:15 "Fonctionnement d’un site"? (45', 3 intervenants ?)


a)Suivi de jobs(15',?)

- Est-ce qu'on peut retracer un job qui a planté pour savoir ce qu'il a utilisé comme ressources et pourquoi il a planté?

-est-ce qu'on peut s'assurer qu'un job qui a bien tourné, a tourné avec les bonnes librairies (Y'a-t-il des vérifications par les sites?)

-Detection de jobs qui se plantent instantanement car probleme sur un WN ?


b)Gestion des pannes(15',?)


-Monitoring local, avez-vous un moyen de verifier « l’integrite » des WN ? Place disque disponible sur chaque WN


c)Le scheduling et le tuning (15',?)

-Peut on mixer job d’analyse et job de simulation sur les WNs (pour optimiser IO et CPU) ?

- le manque d'attractivité d'un site pour les jobs ou l'inverse => état des lieux et amélioration en vue côté mw if any

- la gestion des priorités sur les jobs


17:45 "Gestion de l'infrastructure d'un site" (30',Pierre-Louis, Clermont)

Mise en place d’un site

L’exemple du T2 du LPC Clermont-Ferrand. Visite du site possible durant les 2 jours par petits groupes

  • Salle machine (réseau électrique, climatisation,…)
  • Choix matériel
  • Sécurité
  • Les difficultés rencontrées


15 mars matin (3h30) 9h-10h45 11H15-13h pause 10h45-11h15

Gestion des données grilles

Du point de vue des sites, des collaborations LHC et des utilisateurs

Coordination : Lionel Schwarz, CC-IN2P3 ? ; Representant ALICE, LHCb?

  • Réseaux, trafic
  • Transfert des données SRM, FTS,…
  • Stockage ?


15 mars après-midi (2h40) 14h15-15h45 16H05-17h15 pause 15h45-16h05

Les centres d’analyses

Du point de vue des sites, des collaborations LHC et des utilisateurs

Coordination : Eric Lancon,Dapnia-Saclay ; Claude Charlot ?

  • mise en place
  • les contours
  • les logiciels d’analyses (Ganga,..)
  • Coordination avec les T3s ? mise en commun de ressources ?

Conclusions F Malek