Difference between revisions of "Network Monitoring"

Un article de lcgwiki.
Jump to: navigation, search
(Dashboard)
(Dashboard)
Ligne 35: Ligne 35:
  
 
* LPC, GRIF-LAL - BWCTL : pas de data pour les tests à destination du LPC . Pb ports en entrée ?--[[User:Chollet|Chollet]] 11:38, 2 avril 2014 (CEST)
 
* LPC, GRIF-LAL - BWCTL : pas de data pour les tests à destination du LPC . Pb ports en entrée ?--[[User:Chollet|Chollet]] 11:38, 2 avril 2014 (CEST)
[http://maddash.aglt2.org/serviceTest/bandwidthGraph.cgi?url=http://lapp-ps01.in2p3.fr:8085/perfSONAR_PS/services/pSB&dst=clrperf-bwctl.in2p3.fr&src=lapp-ps01.in2p3.fr&length=2592000  Graph BWCTL LAPP=>LPC] par intermittence ???
+
[http://maddash.aglt2.org/serviceTest/bandwidthGraph.cgi?url=http://lapp-ps01.in2p3.fr:8085/perfSONAR_PS/services/pSB&dst=clrperf-bwctl.in2p3.fr&src=lapp-ps01.in2p3.fr&length=2592000  Graph BWCTL LAPP=>LPC] par intermittence ??? pas depuis le 23 mars
  
 
== Observations avec perfSONAR ==
 
== Observations avec perfSONAR ==

Version du 13:57, 2 avril 2014

Network Monitoring & Debugging

Page permettant de rassembler l'état d'avancement, les observations et éventuels problèmes observésen vue de la réunion technique LCG-France du 16 avril au LPNHE https://indico.in2p3.fr/conferenceDisplay.py?confId=9731 (et au delà si affinités)

Déploiement et MàJ PerfSONAR

Tous les sites doivent avoir une instance perfSONAR-PS opérationelle avant le 1er avril 2014, en version 3.3.2. Les 2 instances perfSONAR (pour les tests de latency et de bandwith) doivent par ailleurs être enregistrées dans la GOC DB.

  • GRIF
    • GRIF-IRFU
    • LPNHE
    • LAL
    • LLR
    • IPNO
  • CC-IN2P3
  • CPPM
  • SUBATECH
  • LPSC
  • LPC en version 3.3.2
  • IPNL
  • IPHC en version 3.3.2

Les tests de latences fonctionnent à peu près, la bandwidth, c'est beaucoup moins bon. Pas mal de soucis avec les démons (remplissent les logs, prennent 100% de CPU, etc.).

  • LAPP en version 3.3.2

P.Seraphin lapp-ps01.in2p3.fr pour les mesures de bande passante lapp-ps02.in2p3.fr pour les mesures de latence.

Dashboard

Ici les questions et observations issues des résultats du dashboard cf http://maddash.aglt2.org/maddash-webui/

  • LPC, GRIF-LAL - BWCTL : pas de data pour les tests à destination du LPC . Pb ports en entrée ?--Chollet 11:38, 2 avril 2014 (CEST)

Graph BWCTL LAPP=>LPC par intermittence ??? pas depuis le 23 mars

Observations avec perfSONAR

Ici les observations faites avec le monitoring perfSONAR susceptibles d'être relayées au niveau des experts réseau

  • 03/2014 IRFU - F.Schaer : Forte asymétrie des flux constatée avec perfSONAR avec un débit sortant vers LHCONE extrêmement dégradé depuis l'IRFU : 20mbits vers Strasbourg par exemple...

pb suivi par les experts réseau FR

Observations avec FTS par les VOs

Ici les observations faites par les expériences

GGUS en cours ou récents en rapport

Ici les tickets GGUS ouverts, récents en lien avec le réseau

Infos diverses

  • Wiki de la task force WLCG : https://twiki.cern.ch/twiki/bin/view/LCG/PerfsonarDeployment
  • Site PS-PS : http://psps.perfsonar.net/index.html
  • Déploiement via Quattor :
    • OK avec la dernière version des templates basé sur le déploiment yum
    • profil utilisant Quattor 14.2.1
  • 28/02/14 F.SChaer :Pour information : si et **quand** vous mettrez vos perfsonar à jour vers la dernière version 3.3.2 ( => yum upgrade) : vous devrez soit rebooter les machines, soit lancer la commande suivante :
/opt/perfsonar_ps/toolkit/scripts/discover_external_address --restart_services

Les scripts init ne seront pas en mesure de relancer les archives perfsonar