Difference between revisions of "Atlas:monitoringsites"

Un article de lcgwiki.
Jump to: navigation, search
 
(Consultation des dashboards (vérifications simples))
 
(8 intermediate revisions by the same user not shown)
Ligne 1: Ligne 1:
 
 
== Activité de Monitoring des sites ATLAS avec DDM ==
 
== Activité de Monitoring des sites ATLAS avec DDM ==
  
Ligne 9: Ligne 8:
 
Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme
 
Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme
  
* 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal
+
* '''1ere activité :''' export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données
** Dashboard : http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1  
+
Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1  
 +
A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s
 +
* '''2nde activité impliquants les T2s-T3s:''' transferts de données liés à la production MC et à la distribution des données réelles
 +
Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1
 +
 +
=== Consultation des dashboards (vérifications simples) ===
 +
 
 +
ici un transfer = un fichier 
 +
* vérifier que le nombre de transfers ''Successes'' et le nombre de ''Registrations'' de ''Files'' sont identiques
 +
**ATTEMPT-DONE : le fichier est transféré sur le SE de destination
 +
**FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
 +
* vérifier l'état des Services 
 +
** DQ : état correspondant au plot ''Total Number Transfer Errors''
 +
** Grid : état des tests SAM des SE des sites
 +
Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM  https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests 
 +
?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...??
 +
Bug report : https://savannah.cern.ch/bugs/?39238
 +
 
 +
 
 +
 
 +
 
  
* 2nde activité : transferts de données liés à la production MC et à la distribution des données réelles
 
** Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1
 
 
 
* [[ Atlas:DDMmonitoring| Throughput plots from DDM monitoring ]]
 
* [[ Atlas:DDMmonitoring| Throughput plots from DDM monitoring ]]

Latest revision as of 09:39, 24 juillet 2008

Activité de Monitoring des sites ATLAS avec DDM

Préliminaire - Notes FC (juillet 08) MAJ : 23.07.08

Il y a en règle générale 2 activités de transfert entre sites à surveiller en parallèle depuis 2 dashboards différents (pour le moment).

Existence de 2 dashboards pour des raisons historiques à l'orgine dashboard centré sur les activités du CERN puis généralisé. Evolution vers un seul à terme

  • 1ere activité : export des données factices type CCRC08 ou cosmiques qui occasionne un traffic permanent depuis le CERN vers les T1s et entre T1s à hauteur de 10 % du taux nominal...pour le moment et jusqu'à l'arrivée des vraies données

Dashboard (T0-T1 et T1-T1): http://dashb-atlas-data-tier0.cern.ch/dashboard/request.py/site?statsInterval=1 A priori pas de transferts vers les T2s sur ce dashboard mais il peut etre intéressant de consulter ce dashboard pour savoir si il y a des transferts du CERN vers Lyon. L'absence de transferts du CERN vers Lyon pouvant logiquement expliquer, l'absence de replication vers les T2s

  • 2nde activité impliquants les T2s-T3s: transferts de données liés à la production MC et à la distribution des données réelles

Dashboard : http://dashb-atlas-data.cern.ch/dashboard/request.py/site?statsInterval=1

Consultation des dashboards (vérifications simples)

ici un transfer = un fichier

  • vérifier que le nombre de transfers Successes et le nombre de Registrations de Files sont identiques
    • ATTEMPT-DONE : le fichier est transféré sur le SE de destination
    • FILE-DONE : le fichier est enregistré à la fois dans le LFC et dans DDM
  • vérifier l'état des Services
    • DQ : état correspondant au plot Total Number Transfer Errors
    • Grid : état des tests SAM des SE des sites

Les résultats de tests SAM présents sur le dashboard ATLAS sont ceux consultables sur le portail SAM https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=SE&regions=France&vo=atlas&order=SiteName&funct=ShowSensorTests ?? cas du LPC en unscheduled down le 23/07/08 time pas pris en compte par le dashb et resté OK...?? Bug report : https://savannah.cern.ch/bugs/?39238