Difference between revisions of "Network Monitoring"

Un article de lcgwiki.
Jump to: navigation, search
(Déploiement et MàJ PerfSONAR)
(Déploiement et MàJ PerfSONAR)
Ligne 9: Ligne 9:
  
 
Tous les sites doivent avoir un service perfSONAR-PS opérationel en version 3.3.2 au le 1er avril 2014.  
 
Tous les sites doivent avoir un service perfSONAR-PS opérationel en version 3.3.2 au le 1er avril 2014.  
Les 2 instances perfSONAR (pour les tests de latency et de bandwith) doivent par ailleurs '''être enregistrées dans la GOC DB'''.
+
* Services BWTCL déclarés : https://goc.egi.eu/portal/index.php?Page_Type=Services&serviceType=net.perfSONAR.Bandwidth&serviceTypeSearch=&ngi=NGI_FRANCE
+
* Services BWTCL déclarés en France : https://goc.egi.eu/portal/index.php?Page_Type=Services&serviceType=net.perfSONAR.Bandwidth&serviceTypeSearch=&ngi=NGI_FRANCE
* Services OWAMP :https://goc.egi.eu/portal/index.php?Page_Type=Services&serviceType=net.perfSONAR.Latency&serviceTypeSearch=&ngi=NGI_FRANCE
+
* Services OWAMP en France :https://goc.egi.eu/portal/index.php?Page_Type=Services&serviceType=net.perfSONAR.Latency&serviceTypeSearch=&ngi=NGI_FRANCE
* GRIF
+
* soit 9 services en version 3.3.2, enregistrés dans la GOC DB
** GRIF-IRFU
+
** GRIF : IRFU, LPNHE, LAL
** LPNHE
+
** CC-IN2P3
** LAL
+
** CPPM
** LLR
+
** LAPP
** IPNO
+
** LPC
* CC-IN2P3
+
** LPSC
* CPPM  
+
** IPHC
* SUBATECH 
+
   
* LPSC  
+
* En cours ou à voir
* LPC en version 3.3.2
+
** GRIF : LLR, IPNO
* IPNL   
+
** SUBATECH  
* IPHC en version 3.3.2 
+
** IPNL   
 +
 
 
Les tests de latences fonctionnent à peu près, la bandwidth, c'est beaucoup moins bon. Pas mal de soucis avec les démons (remplissent les logs, prennent 100% de CPU, etc.).
 
Les tests de latences fonctionnent à peu près, la bandwidth, c'est beaucoup moins bon. Pas mal de soucis avec les démons (remplissent les logs, prennent 100% de CPU, etc.).
 
* LAPP en version 3.3.2
 
* LAPP en version 3.3.2

Version du 16:56, 8 avril 2014

Network Monitoring & Debugging

Page permettant de rassembler l'état d'avancement, les observations et éventuels problèmes observésen vue de la réunion technique LCG-France du 16 avril au LPNHE https://indico.in2p3.fr/conferenceDisplay.py?confId=9731 (et au delà si affinités)

Déploiement et MàJ PerfSONAR

Tous les sites doivent avoir un service perfSONAR-PS opérationel en version 3.3.2 au le 1er avril 2014.

  • En cours ou à voir
    • GRIF : LLR, IPNO
    • SUBATECH
    • IPNL

Les tests de latences fonctionnent à peu près, la bandwidth, c'est beaucoup moins bon. Pas mal de soucis avec les démons (remplissent les logs, prennent 100% de CPU, etc.).

  • LAPP en version 3.3.2

P.Seraphin lapp-ps01.in2p3.fr pour les mesures de bande passante lapp-ps02.in2p3.fr pour les mesures de latence.

Dashboard

Ici les questions et observations issues des résultats du dashboard cf http://maddash.aglt2.org/maddash-webui/

BWCTL No throughput data
  • pas de data pour les tests à destination du LPC et du LAL --Chollet 11:38, 2 avril 2014 (CEST)

Message For Current Status: No throughput data returned for direction where src=lpnhe-psb.in2p3.fr dst=clrperf-bwctl.in2p3.fr Graph BWCTL LAPP=>LPC par intermittence ??? pas de résultats depuis le 23 mars

Observations avec perfSONAR

Ici les observations faites avec le monitoring perfSONAR susceptibles d'être relayées au niveau des experts réseau

  • 03/2014 IRFU - F.Schaer : Forte asymétrie des flux constatée avec perfSONAR avec un débit sortant vers LHCONE extrêmement dégradé depuis l'IRFU : 20mbits vers Strasbourg par exemple...

pb suivi par les experts réseau FR

Observations avec FTS par les VOs

Ici les observations faites par les expériences

  • ATLAS S.Jézéquel
    • LPC -> BNL/TRIUMF (GGUS: 102924) : Low transfer rate (300-400 kB/s) for all transfers
    • IRFU -> BNL/TRIUMF : Low transfer rate : Frederic Shaer is working on it with Renater (issue pointed with Perfsonar)
    • LAL -> TOKYO : Issue raised few years ago and never solved. It is still visible with current FTS transfers (~100 kB/s)

GGUS en cours ou récents en rapport

Ici les tickets GGUS ouverts, récents en lien avec le réseau

Infos diverses

  • Wiki de la task force WLCG : https://twiki.cern.ch/twiki/bin/view/LCG/PerfsonarDeployment
  • Site PS-PS : http://psps.perfsonar.net/index.html
  • Déploiement via Quattor :
    • OK avec la dernière version des templates basé sur le déploiment yum
    • profil utilisant Quattor 14.2.1
  • 28/02/14 F.SChaer :Pour information : si et **quand** vous mettrez vos perfsonar à jour vers la dernière version 3.3.2 ( => yum upgrade) : vous devrez soit rebooter les machines, soit lancer la commande suivante :
/opt/perfsonar_ps/toolkit/scripts/discover_external_address --restart_services

Les scripts init ne seront pas en mesure de relancer les archives perfsonar