Difference between revisions of "Draft of the scientific programm"
(→<span style="color:#FF0000;"> Gestion et exploitation des grilles de calcul) |
(→<span style="color:#FF0000;"> Gestion et exploitation des grilles de calcul) |
||
Ligne 97: | Ligne 97: | ||
<P> | <P> | ||
− | <B>16:45 "Exploitation globale de la grille" (20' + 10 | + | <B>16:45 "Exploitation globale de la grille" (20' + 10', Hélène C.)</B> |
<UL> | <UL> | ||
<LI>Interaction entre outils de gestion de l'exploitation et la production</LI> | <LI>Interaction entre outils de gestion de l'exploitation et la production</LI> | ||
Ligne 135: | Ligne 135: | ||
<P> | <P> | ||
− | <B>17:45 "Gestion de l'infrastructure d'un site" (30',Pierre-Louis, Clermont)</B> | + | <B>17:45 "Gestion de l'infrastructure d'un site" (30',Pierre-Louis, Clermont)</B> |
</P> | </P> | ||
Version du 11:12, 9 février 2007
D.P. 31/01/2007
Sommaire
Objectifs
LCG-France organise son 2ème colloque à Clermont-Ferrand les 14 et 15 mars 2007. Ces journées sont destinées à tous les acteurs de la grille de calcul au LHC (gestionnaires de site et utilisateurs) de l'IN2P3 et du Dapnia. Elles ont pour objectifs d’offrir un lieu d’échange et de communication sur les actions, les idées et les expériences en cours dans la mise en place du calcul pour le LHC dans le cadre du projet LCG.
Programme Scientifique version 1 (7/12/06)
14 mars matin (3h) 9h30-11h 11H30-13h pause 11h-11h30
9h30-9h35 Welcome
Etat des lieux pour le calcul au LHC en France
Coordination : Ghita Rahal,CC-IN2P3; Dominique Pallin, LPC-Clermont
- 09:35-09:45 -Infrastructure globale de grille en France et ressources associées F Malek
- 09:45-10:00 -Présentation des sites (T1 et sites associés) D Boutigny
- 10:00-10:20 -Présentation des sites (T2 etT3, T2 étrangers associés) F Chollet
- 10:20-10:40 -mise en place de La grille francaise: F Hernandez
- Les difficultés rencontrées;
- adéquation modèles de calcul - infrastructure/ressources (du point de vue des sites)
- Son évolution en vue des données LHC 2009-2010
- 10:40-11:00 & 11h30-13:00 -Présentation de l'état du calcul dans les expériences:
- Les modèles de calcul des expériences (overview)
- Quelle participation dans la mise en place du calcul (en france)?
- Adéquation entre les infrastructures/ressources et les besoins.
- Etat de la production des données de simulation
- Etat d'avancement par rapport à l'objectif de la prise de données de fin 2007.
- Difficultés, les points à améliorer…
- 10:40-11:00 -ALICE Y schutz
- 11:00-11h30 ----------------- Pause ---------------------------
- 11:30-11:50 -ATLAS E Lancon
- 11:50-12:10 -CMS C Charlot ?
- 12:10-12:30 -LHCb A Tsaregorodtsev ?
- 12:30-13:00 -discussion/tour de table sur l'ensemble de la session
- la grille francaise, sa mise en place et son utilisation, Du point de vue des sites, des collaborations LHC et des utilisateurs
14 mars après-midi (3h) 14h45-16h15 16H45-18h15 pause 16h15-16h45
Gestion et exploitation des grilles de calcul
Couvrir 2 aspects complémentaires :
-les actions des sites -> les conséquences au niveau des utilisateurs
-les actions des utilisateurs -> les conséquences au niveau des sites
Coordination : Christine Leroy, Dapnia-Saclay; Pierre Girard, Ingénieur, CC-IN2P3
- le fonctionnement d'un site de la grille :
du déploiement du middleware à la gestion de sa production, en passant par les procédures qu'il doit suivre, comme la déclaration de "scheduled downtime", l'utilisation des outils officiels de monitoring (SAM, GSTAT, etc) et leurs conséquences (disparition partielle ou complète de la production, etc), sécurité,etc.
- la gestion de jobs grilles :
de la façon dont ils sont soumis par les utilisateurs à la façon dont ils sont traités par les sites (dont la mise au point des formules de rank pour l'élection d'un site de soumission, le manque d'attractivité d'un site pour les jobs ou l'inverse, la gestion des priorités sur les jobs, des jobs pilotes, exécuteurs, etc.)
A- Sous-session "Gestion des jobs grille"
Dans cette première sous-session, il est demandé à chaque VO d'apporter des clarifications concernant les points suivants :
- Méthode(s) de distribution des jobs sur les sites :
- utilisation ou non d'un RB ?
- utilisation ou non des informations publiées ?
- Critère d'élection d'un site ? etc.
- Organisation de la production
- qui fait quoi, qui soumet quoi, les rôles, les histoires de priorité...
- une production française ou pas
- Système de monitoring pour les jobs ? Si oui, utilisable ou pas par les sites ? Quel est son principe de fonctionnement, etc.
- gestion des proxy
- Méthode d'installation des softs (+ desinstallation)
- comment un nouvel OS est validé et l'information transmise
- Amélioration attendue et perspectives pour la gestion des jobs
14:45 Introduction (5', Christine/Pierre) 14:50 Spécificités d'Alice (10', Artem ?) 15:00 Spécificités d'Atlas (10', Jérôme Schwi? Stéphane ? Karim ?) 15:10 Spécificités de Cms (10', Claude ? Artem ?) 15:20 Spécificités de Lhcb (10', Andrei ou Sabine?) 15:30 Discussions (45')
B- Sous-Session "Fonctionnement des sites"
16:45 "Exploitation globale de la grille" (20' + 10', Hélène C.)
- Interaction entre outils de gestion de l'exploitation et la production
- Comment les utilisateurs peuvent accéder aux informations
- les outils d'exploitation (GOC DB, SAM, GSTAT, MonALISA et le CIC Portal)
- L'accounting
- Comment mesurer l’efficacite d’un site (utilisationCPU/CPU; resource disponible/resource indisponible ;jobs plantes/ jobs/reussis)
17:15 "Fonctionnement d’un site"? (45', 3 intervenants ?) <0L>
- Est-ce qu'on peut retracer un job qui a planté pour savoir ce qu'il a utilisé comme ressources et pourquoi il a planté?
- Est-ce qu'on peut s'assurer qu'un job qui a bien tourné, a tourné avec les bonnes librairies (Y'a-t-il des vérifications par les sites?)
- Detection de jobs qui se plantent instantanement car probleme sur un WN ?
- Monitoring local, avez-vous un moyen de verifier « l’integrite » des WN ? Place disque disponible sur chaque WN
- Peut on mixer job d’analyse et job de simulation sur les WNs (pour optimiser IO et CPU) ?
- Le manque d'attractivité d'un site pour les jobs ou l'inverse => état des lieux et amélioration en vue côté mw if any
- la gestion des priorités sur les jobs
17:45 "Gestion de l'infrastructure d'un site" (30',Pierre-Louis, Clermont)
Mise en place d’un site
L’exemple du T2 du LPC Clermont-Ferrand. Visite du site possible durant les 2 jours par petits groupes
- Salle machine (réseau électrique, climatisation,…)
- Choix matériel
- Sécurité
- Les difficultés rencontrées
15 mars matin (3h30) 9h-10h45 11H15-13h pause 10h45-11h15
Gestion des données grilles
Du point de vue des sites, des collaborations LHC et des utilisateurs
Coordination : Lionel Schwarz, CC-IN2P3 ? ; Representant ALICE, LHCb?
- Réseaux, trafic
- Transfert des données SRM, FTS,…
- Stockage ?
15 mars après-midi (2h40) 14h15-15h45 16H05-17h15 pause 15h45-16h05
Les centres d’analyses
Du point de vue des sites, des collaborations LHC et des utilisateurs
Coordination : Eric Lancon,Dapnia-Saclay ; Claude Charlot ?
- mise en place
- les contours
- les logiciels d’analyses (Ganga,..)
- Coordination avec les T3s ? mise en commun de ressources ?