Difference between revisions of "Network Monitoring"
(→Observations avec FTS par les VOs) |
(→BWCTL No throughput data) |
||
Ligne 37: | Ligne 37: | ||
* pas de data pour les tests à destination du LPC et du LAL --[[User:Chollet|Chollet]] 11:38, 2 avril 2014 (CEST) | * pas de data pour les tests à destination du LPC et du LAL --[[User:Chollet|Chollet]] 11:38, 2 avril 2014 (CEST) | ||
− | + | Message For Current Status: No throughput data returned for direction where src=lpnhe-psb.in2p3.fr dst=clrperf-bwctl.in2p3.fr | |
[http://maddash.aglt2.org/serviceTest/bandwidthGraph.cgi?url=http://lapp-ps01.in2p3.fr:8085/perfSONAR_PS/services/pSB&dst=clrperf-bwctl.in2p3.fr&src=lapp-ps01.in2p3.fr&length=2592000 Graph BWCTL LAPP=>LPC] par intermittence ??? pas de résultats depuis le 23 mars | [http://maddash.aglt2.org/serviceTest/bandwidthGraph.cgi?url=http://lapp-ps01.in2p3.fr:8085/perfSONAR_PS/services/pSB&dst=clrperf-bwctl.in2p3.fr&src=lapp-ps01.in2p3.fr&length=2592000 Graph BWCTL LAPP=>LPC] par intermittence ??? pas de résultats depuis le 23 mars | ||
Version du 13:56, 7 avril 2014
Network Monitoring & Debugging
Page permettant de rassembler l'état d'avancement, les observations et éventuels problèmes observésen vue de la réunion technique LCG-France du 16 avril au LPNHE https://indico.in2p3.fr/conferenceDisplay.py?confId=9731 (et au delà si affinités)
Sommaire
Déploiement et MàJ PerfSONAR
Tous les sites doivent avoir une instance perfSONAR-PS opérationelle avant le 1er avril 2014, en version 3.3.2. Les 2 instances perfSONAR (pour les tests de latency et de bandwith) doivent par ailleurs être enregistrées dans la GOC DB.
- GRIF
- GRIF-IRFU
- LPNHE
- LAL
- LLR
- IPNO
- CC-IN2P3
- CPPM
- SUBATECH
- LPSC
- LPC en version 3.3.2
- IPNL
- IPHC en version 3.3.2
Les tests de latences fonctionnent à peu près, la bandwidth, c'est beaucoup moins bon. Pas mal de soucis avec les démons (remplissent les logs, prennent 100% de CPU, etc.).
- LAPP en version 3.3.2
P.Seraphin lapp-ps01.in2p3.fr pour les mesures de bande passante lapp-ps02.in2p3.fr pour les mesures de latence.
Dashboard
Ici les questions et observations issues des résultats du dashboard
cf http://maddash.aglt2.org/maddash-webui/
BWCTL No throughput data
- pas de data pour les tests à destination du LPC et du LAL --Chollet 11:38, 2 avril 2014 (CEST)
Message For Current Status: No throughput data returned for direction where src=lpnhe-psb.in2p3.fr dst=clrperf-bwctl.in2p3.fr Graph BWCTL LAPP=>LPC par intermittence ??? pas de résultats depuis le 23 mars
Observations avec perfSONAR
Ici les observations faites avec le monitoring perfSONAR susceptibles d'être relayées au niveau des experts réseau
- 03/2014 IRFU - F.Schaer : Forte asymétrie des flux constatée avec perfSONAR avec un débit sortant vers LHCONE extrêmement dégradé depuis l'IRFU : 20mbits vers Strasbourg par exemple...
pb suivi par les experts réseau FR
Observations avec FTS par les VOs
Ici les observations faites par les expériences
- ATLAS S.Jézéquel
- LPC -> BNL/TRIUMF (GGUS: 102924) : Low transfer rate (300-400 kB/s) for all transfers
- IRFU -> BNL/TRIUMF : Low transfer rate : Frederic Shaer is working on it with Renater (issue pointed with Perfsonar)
- LAL -> TOKYO : Issue raised few years ago and never solved. It is still visible with current FTS transfers (~100 kB/s)
GGUS en cours ou récents en rapport
Ici les tickets GGUS ouverts, récents en lien avec le réseau
- 02/2014 (solved by ESNET) - BNL -> T2 FR / IT : https://ggus.eu/index.php?mode=ticket_info&ticket_id=101637
Infos diverses
- Wiki de la task force WLCG : https://twiki.cern.ch/twiki/bin/view/LCG/PerfsonarDeployment
- Site PS-PS : http://psps.perfsonar.net/index.html
- Déploiement via Quattor :
- OK avec la dernière version des templates basé sur le déploiment yum
- profil utilisant Quattor 14.2.1
- 28/02/14 F.SChaer :Pour information : si et **quand** vous mettrez vos perfsonar à jour vers la dernière version 3.3.2 ( => yum upgrade) : vous devrez soit rebooter les machines, soit lancer la commande suivante :
/opt/perfsonar_ps/toolkit/scripts/discover_external_address --restart_services
Les scripts init ne seront pas en mesure de relancer les archives perfsonar