Difference between revisions of "ARCHIVES/LCG-FR / SA1-FR Monitoring WG"

Un article de lcgwiki.
Jump to: navigation, search
(Contacts (Mailing list))
(Réunions, Journées...)
Ligne 36: Ligne 36:
 
*[http://indico.cern.ch/conferenceDisplay.py?confId=35322 OAT: Describe new structure of current operational model section + Review architecture sections 05 June 2008]
 
*[http://indico.cern.ch/conferenceDisplay.py?confId=35322 OAT: Describe new structure of current operational model section + Review architecture sections 05 June 2008]
 
* [http://indico.in2p3.fr/conferenceDisplay.py?confId=1000 LCG-tech-fr Sa1-fr teleconf: 1) résumé document OAT & 2)bilan questionnaire]
 
* [http://indico.in2p3.fr/conferenceDisplay.py?confId=1000 LCG-tech-fr Sa1-fr teleconf: 1) résumé document OAT & 2)bilan questionnaire]
 +
 +
== Infrastructure de monitoring ==
 +
 +
*l’infrastructure d’échange de messages pour le  « multi-level » monitoring: https://twiki.cern.ch/twiki/bin/view/LCG/MessagingSystemforGrid
  
 
== Liens Utiles ==
 
== Liens Utiles ==

Version du 13:58, 3 juillet 2008

Contacts (Mailing list)

LCG-SA1FR-MONITORING-L@IN2P3.FR mailing list : List managers : Christine Leroy (Irfu/CEA)

les membres du groupe: http://lcg.in2p3.fr/wiki/images/MembresOnly.doc

Mandat du Groupe

Document consultable: https://edms.in2p3.fr/file/I-013168/1/LCG-France-SA1-FR_WGMonitoring.pdf

Le groupe de travail se chargera dans un délai de 6 mois :

  • collecter les besoins des responsables des sites et de services de la région,
  • recenser les pratiques des sites et les outils de monitoring utilisés,
  • représenter et défendre les intérêts de la région dans les différents groupes de travail existants au sein de WLCG-EGEE sur un sujet connexe (En cours de construction un Groupe EGEE: OAT)
  • identifier les standards qui doivent être suivis ainsi que les outils pertinents à tous les niveaux (services, site et région), proposer aux responsables des sites, des services grid et de l’opération régionale de la grille EGEE un ensemble d'outils répondant à leurs besoins,
  • proposer, si besoin, des améliorations sur les outils et procédures d’alertes au niveau des sites, au niveau de la région
  • établir, s’il y a lieu, un plan pour la poursuite de ses travaux au-delà de la période initiale des 6 premiers mois.

Toutes les propositions et recommandations devront a priori être cohérentes avec les orientations des projets EGEE et WLCG.

L'organisation et le mode de fonctionnement du groupe seront définis par le responsable du groupe et les membres eux-mêmes.

Réunions, Journées...

Infrastructure de monitoring

Liens Utiles

Services Grilles

FTS

CCIN2P3 RAL atlas RAL Ganglia

GridFtp

ICEPP


DPM

DPM monitoring by Gridpp

Services VOs

LHC VOs

Experiment Dashboard

ALICE

* Monalisa monitoring:  http://pcalimonitor.cern.ch/ 
* Job Monitoring:  http://dashboard.cern.ch/alice/
* Daily reports:     http://dashb-alice.cern.ch/dashboard/data/
* Site efficiency :  http://dboard-gr.cern.ch/dashboard/data/summaries/

ATLAS

* Dashboard :  http://dashboard.cern.ch/atlas/
* Installation SW : https://atlas-install.roma1.infn.it/atlas_install/
* Bilan mensuel du nombre de jobs exécutés et de l'efficacité par site : http://dashb-atlas-job.cern.ch/dashboard/request.py/MonthlyReportIndex
* PanDA : http://gridinfo.triumf.ca/panglia. Il y a un URL par queue utilisée par les jobs de productions + 1 URL spécifique pour les queues utilisées par les jobs d'analyse (ANALY_xxx). Pour les jobs de productions
 

Le dashboard a tendance à remplacer les autres (excepté pour le suivi des installations). C'est le plus complet et le plus riche. Il permet en particulier d'obtenir la liste des jobs en erreur avec des informations détaillées sur l'erreur, le WN impliqué...

BIOMED

CMS

* Job Monitioring : http://dashboard.cern.ch/cms
* CRAB JobRobot summary : http://jobrobot.web.cern.ch/JobRobot/summary_071002.html
* Link Commissioning Status : 
 T1-T2_FR downlinks
 T2_FR-T1 uplinks 
* CMS SAM Visualization : http://lxarda16.cern.ch/dashboard/request.py/latestresultsview
* Site Commissionning board : http://lxarda16.cern.ch/dashboard/request.py/siteview?debug=1

LHCb

* Site status for LHCb usage : http://lhcb-project-dirac.web.cern.ch/lhcb-project-dirac/lhcbProdnMask.html
* Dashboard : http://dashboard.cern.ch/lhcb/

Infrastructure Grille

GridMap Prototype visualizing the "State" of the Grid

WLCG Monitoring Working groups

3 groups have been created. See https://twiki.cern.ch/twiki/bin/view/LCG/LCGMonitoringWorkingGroups The most active one is the Grid Service Monitoring group chaired by James Casey and Ian Neilson (FC)

EGEE Monitoring Group

Old one:


Open GGUS Tickets assigned to ROC-France