Atlas:monitoringsites

Un article de lcgwiki.
Jump to: navigation, search

Activité de Monitoring des sites ATLAS avec DDM

Préliminaire - Notes FC (juillet 08) MAJ : 23.07.08

Il y a en règle générale 2 activités de transfert entre sites à surveiller en parallèle depuis 2 dashboards différents (pour le moment).

Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme

  • 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données

Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1 A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s

  • 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles

Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1

Consultation des dashboards (vérifications simples)

ici un transfer = un fichier

  • vérifier que le nombre de transfers Successes et le nombre de Registrations de Files sont identiques
    • ATTEMPT-DONE : le fichier est transféré sur le SE de destination
    • FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
  • vérifier l'état des Services
    • DQ : état correspondant au plot Total Number Transfer Errors
    • Grid : état des tests SAM des SE des sites

Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests ?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...?? Bug report : https://savannah.cern.ch/bugs/?39238