Difference between revisions of "Atlas:monitoringsites"

Un article de lcgwiki.
Jump to: navigation, search
(Activité de Monitoring des sites ATLAS avec DDM)
(Consultation des dashboards (vérifications simples))
 
(3 intermediate revisions by the same user not shown)
Ligne 17: Ligne 17:
  
 
ici un transfer = un fichier   
 
ici un transfer = un fichier   
** vérifier que le nombre de transfers ''Successes'' et le nombre de ''Registrations'' de ''Files'' sont identiques  
+
* vérifier que le nombre de transfers ''Successes'' et le nombre de ''Registrations'' de ''Files'' sont identiques  
***ATTEMPT-DONE : le fichier est transféré sur le SE de destination
+
**ATTEMPT-DONE : le fichier est transféré sur le SE de destination
***FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM  
+
**FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM  
** vérifier l'état des Services   
+
* vérifier l'état des Services   
*** DQ : état correspondant au plot ''Total Number Transfer Errors''
+
** DQ : état correspondant au plot ''Total Number Transfer Errors''
*** Grid : état des tests SAM des SE des sites  
+
** Grid : état des tests SAM des SE des sites
 +
Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM  https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests 
 
?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...??
 
?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...??
 
Bug report : https://savannah.cern.ch/bugs/?39238
 
Bug report : https://savannah.cern.ch/bugs/?39238

Latest revision as of 08:39, 24 juillet 2008

Activité de Monitoring des sites ATLAS avec DDM

Préliminaire - Notes FC (juillet 08) MAJ : 23.07.08

Il y a en règle générale 2 activités de transfert entre sites à surveiller en parallèle depuis 2 dashboards différents (pour le moment).

Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme

  • 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données

Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1 A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s

  • 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles

Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1

Consultation des dashboards (vérifications simples)

ici un transfer = un fichier

  • vérifier que le nombre de transfers Successes et le nombre de Registrations de Files sont identiques
    • ATTEMPT-DONE : le fichier est transféré sur le SE de destination
    • FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
  • vérifier l'état des Services
    • DQ : état correspondant au plot Total Number Transfer Errors
    • Grid : état des tests SAM des SE des sites

Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests ?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...?? Bug report : https://savannah.cern.ch/bugs/?39238