Atlas:monitoringsites: Difference between revisions

Un article de lcgwiki.
Jump to navigation Jump to search
Chollet (talk | contribs)
Chollet (talk | contribs)
 
(6 intermediate revisions by the same user not shown)
Ligne 8: Ligne 8:
Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme
Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme


* 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données
* '''1ere activité :''' export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données
** Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1  
Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1  
A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s  
A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s  
* 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles  
* '''2nde activité impliquants les T2s-T3s:''' transferts de données liés à la production MC et à la distribution des données réelles  
** Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1
Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1
   
   
=== Consultation des dashboards (vérifications simples) ===


* Consultation des dashboards (vérifications simples à faire):
ici un transfer = un fichier   
ici un transfer = un fichier   
** vérifier que le nombre de transfers ''Successes'' et le nombre de ''Registrations'' de ''Files'' sont identiques  
* vérifier que le nombre de transfers ''Successes'' et le nombre de ''Registrations'' de ''Files'' sont identiques  
***ATTEMPT-DONE : le fichier est transféré sur le SE de destination
**ATTEMPT-DONE : le fichier est transféré sur le SE de destination
***FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM  
**FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM  
** vérifier l'état des Services   
* vérifier l'état des Services   
*** DQ : état correspondant au plot ''Total Number Transfer Errors''
** DQ : état correspondant au plot ''Total Number Transfer Errors''
*** Grid : état des tests SAM des SE des sites  
** Grid : état des tests SAM des SE des sites
?? cas du LPC en unscheduled down time pas pris en compte et resté OK...??
Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM  https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests 
?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...??
Bug report : https://savannah.cern.ch/bugs/?39238
 





Latest revision as of 09:39, 24 juillet 2008

Activité de Monitoring des sites ATLAS avec DDM

Préliminaire - Notes FC (juillet 08) MAJ : 23.07.08

Il y a en règle générale 2 activités de transfert entre sites à surveiller en parallèle depuis 2 dashboards différents (pour le moment).

Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme

  • 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données

Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1 A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s

  • 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles

Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1

Consultation des dashboards (vérifications simples)

ici un transfer = un fichier

  • vérifier que le nombre de transfers Successes et le nombre de Registrations de Files sont identiques
    • ATTEMPT-DONE : le fichier est transféré sur le SE de destination
    • FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
  • vérifier l'état des Services
    • DQ : état correspondant au plot Total Number Transfer Errors
    • Grid : état des tests SAM des SE des sites

Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests ?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...?? Bug report : https://savannah.cern.ch/bugs/?39238