Atlas:monitoringsites

Un article de lcgwiki.
Jump to navigation Jump to search
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

Activité de Monitoring des sites ATLAS avec DDM

Préliminaire - Notes FC (juillet 08) MAJ : 23.07.08

Il y a en règle générale 2 activités de transfert entre sites à surveiller en parallèle depuis 2 dashboards différents (pour le moment).

Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme

  • 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données

Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1 A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s

  • 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles

Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1

Consultation des dashboards (vérifications simples)

ici un transfer = un fichier

  • vérifier que le nombre de transfers Successes et le nombre de Registrations de Files sont identiques
      • ATTEMPT-DONE : le fichier est transféré sur le SE de destination
      • FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
  • vérifier l'état des Services
      • DQ : état correspondant au plot Total Number Transfer Errors
      • Grid : état des tests SAM des SE des sites

?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...?? Bug report : https://savannah.cern.ch/bugs/?39238