User talk:LEROY

Un article de lcgwiki.
Revision as of 14:34, 26 avril 2007 by LEROY (talk | contribs) (Les tests de transferts)
Jump to: navigation, search

Installation et Configuration d'une VO-BOX ALICE

TracNav

TOC(inline)

Introduction

Un site grille qui souhaite supporter l'expérience ALICE, doit installer une VO-BOX. ALICE utilise AliEN (Alice ENvironment) comme plateforme logicielle pour la simulation et l'analyse des données. Alien est installé sur chaque VO-BOX. C'est le CE d'Alien qui soumet les Job Agents (JAs) au CE du site. Les JAs vont ensuite chercher les jobs dans central Task Queue de Alien. Les jobs écrivent via xrootd (directement vers le CERN pour le moment). Comme il n'y a pas encore d'interface xrootd/SRM, chaque VO-BOX doit fournir un stockage xrootd qui peut être sur un disque local.

Les documents à lire impérativement (en plus de ce guide) sont:

* ALICE LCG VO-Box Installation Guide
* VOBOX Security and Operations Questionnaires

La VO-BOX n'est pas consommatrice en CPU et RAM. N'importe quel PC récent(Pentium+) avec 2GB+ de RAM peut faire l'affaire. Cependant un bon hardware est recommandé pour minimiser la fréquence des pannes.

Ressources disques requises

* Partition / (root) : au moins 2 GB
* Partition /var : y prévoir 10-15 GB d'espace pour les logs d'Alien
* /data (ou un autre nom) : partition local pour xrootd (prévoir 3G par job slot)

Remarques:

 1. xrootd: sur un site avec plus de 30 job slots, passer si possible au mode "head node + xrootd servers" pour des raisons de performances
 2. "/home" doit être local pour des raisons de performances et de gestion des "locks"

Les ports à ouvrir pour la VO-BOX au niveau du router

* 1975/tcp (gsissh): inbound from 137.138.0.0/16 and 192.16.186.192/26
* 1094/tcp(xrootd)
* 8082/tcp (Storage Adapter)
* 8083 (FTD)
* 8084/tcp (Site Proxy)
* 9991/tcp (PackMan) : Inbound from 137.138.0.0/16
* 1093/tcp (proofd)

Le profile de la VO-BOX sous Quattor

Dans clusters/<nom_site>-glite-x.y.z/profiles/profile_<nom_vobox>.tpl, faire:

{{{

include pro_<nom_site>_alice_glite_vobox; (voir cfg/clusters/ipno-glite-3.0.0/profiles/profile_ipnvobox.tpl)

}}}

Dans sites/<nom_site>/machine-types, créer pro_<nom_site>_alice_glite_vobox.tpl et pro_<nom_site>_alice_vobox_config.tpl

Vous pouvez copier et adpater les templates de l'IPNO ou du DAPNIA.

Après l'installation via Quattor de la machine

* Demander et installer le certificat serveur GRID-FR de la mchine
* Vérifier que les utilisateurs alis et alip existent dans /etc/passwd
* Verifier que Patricia Lorenzo Mendez et Artem Trunov sont bien mappés sur
 alis dans /etc/grid-security/grid-mapfile et qu'il y a quelqu'un mappé
 sur alip. Question ouverte: faut-il creer les pool accounts ? Ou faut-il
 créer uniqument les comptes alis, alip nécessaires pour ALICE ?
* Dans /etc/shadow vous devez avoir '*' dans le champ 'password', sinon le logingsissh ne marchera pas. Donc il faut remplacer '!!' ou '!*NP*' par '*'
{{{

[root@ipnvobox etc]# grep alis /etc/shadow alis:*:13574:0:99999:7:::

}}}
* Vérifier que le serveur GSISSH tourne sur la VOBOX sur le port 1975.
* Vérifier que $MYPROXY_SERVER pointe bien sur myproxy.cern.ch
* Vérifier que la expérimental software area ($VO_ALICE_SW_DIR) est bien accessible via NFS depuis la VO-BOX et writeable par alis. Il faut au moins 5GB d'espace libre pour le soft d'ALICE.
* Vérifier que la partition /data pour xrootd existe et appartient à alis (/data doit être crée sous Quattor ou à la main)
{{{

[root@ipnvobox root]# ls -ld /data drwxr-xr-x 19 alis alice 4096 Dec 14 13:22 /data

}}}
* Créer un directory pour les logs d'Alien (ex: /var/log/alis). Il doit appartenir à alis et nécessite 10-15 GB libre.
{{{

[root@ipnvobox root]# ls -ld /var/log/alis drwxrwxrwx 10 alis alice 4096 Mar 2 16:54 /var/log/alis

}}}
* Configurer le proxy-renewal service. MAIS, le script /opt/vobox/templates/voname-box-proxyrenewal n'est pas encore exécuté automatiquement. Cal a prévu de corriger le probleme. Donc si après l'installation de la VO-BOX, il manque alice-box-proxyrenewal dans /etc/cron.d/ et dans /etc/init.d/ ainsi que start, stop, agents et info-provider dans /opt/vobox/alice/, alors faire:
 1. créer /etc/cron.d/alice-box-proxyrenewal:
{{{

[root@ipnvobox root]# cat /etc/cron.d/alice-box-proxyrenewal

  1. !/bin/sh

20 2,8,14,20 * * * root (PATH=/sbin:/bin:/usr/sbin:/usr/bin; /sbin/service alice-box-proxyrenewal proxy)

}}}
 2. copier /opt/vobox/templates/voname-box-proxyrenewal dans
   /tmp/alice-proxy-renewal.sh, adpatez-le et exécutez-le (le script que j'ai
   utilisé est en attachement: alice-proxy-renewal.sh).
 3. vous devez alors retrouver les directories qui manquaient:
{{{

[root@ipnvobox alice]# ls -l total 44 drwx------ 2 alis alice 4096 Jul 19 2006 agents -rw-rw-rw- 1 alis alice 0 Nov 14 09:09 edglog.log drwx------ 2 alis alice 4096 Jul 19 2006 info-provider drwx------ 2 alis alice 4096 Mar 1 04:02 log drwx------ 2 alis alice 4096 Mar 2 17:19 proxy_repository -rw------- 1 alis alice 13750 Mar 2 17:04 _registerer_proxies.db -r-------- 1 alis alice 2690 Mar 2 14:20 renewal-proxy.pem drwx------ 2 alis alice 4096 Aug 6 2006 start drwx------ 2 alis alice 4096 Aug 5 2006 stop

}}}
* Envoyer un e-mail à: Patricia.Mendez@cern.ch, latchezar.betev@cern.ch et trunov@cc.in2p3.fr :

1. demander que la machine soit enregistrée 'as trusted host' dans myproxy.cern.ch dans LDAP (il faut fournir le DN de la VOBOX). 2. fournir les informations suivantes dans le mail:

 * hostname de la VO-BOX
 * le nom des users: alicesgm (alis dans GRIF), alip (ALICE Production)
 * le nom directory pour xrootd (ex: /data)
 * le nom du SE/DPM Server (ex: ipnsedpm.in2p3.fr)
 * le nom du serveur LFC (ex: grid14.lal.in2p3.fr) et le catalogue pour
   ALICE (/grid/alice)
 * le nom du RB (ex: grid09.lal.in2p3.fr)
 * le nom du CE et de la queue batch
   (ex: ipnls2001.in2p3.fr:2119/jobmanager-pbs-alice)
 * le path pour le experiment software area
   (ex:VO_ALICE_SW_DIR=/ipn/storage1/exp_soft/alis, zone "NFS shared" avec les WNs)
* Installer Alien ou demander que Artem ou Patricia vous l'installe.
* S'inscrire individullement dans le projet ALICE (voir avec un physicien d'ALICE du Labo et avec le Secrétariat d'ALICE) :
 1. demander un logon au CERN (si vous n'en avez pas déjà)
 2. demander à être enregistré comme membre du projet ALICE
* Inscrivez-vous dans AliEn en suivant les étapes sur la page http://alien.cern.ch/twiki/bin/view/Alice/UserRegistration
 1. Vous serez amenés à vous inscrire dans la VO ALICE (si ce n'est pas déjà fait)  sur https://lcg-voms.cern.ch:8443/vo/alice/vomrs
 2. Ensuite vous pourrez vous inscrire dans AliEn ("5. Register with AliEn" sur
   https://alien.cern.ch:8443/twiki/bin/UserReg
* Demander ensuite à être mapé sur 'alidprod' si vous voulez pouvoir utiliser AliEn sous votre nom (ALIEN_USER=user_name dans ~alis/.alien/Environment) la VO-BOX (start/stop des services par exemples)
* Mettre dans /etc/motd des informations utiles à afficher lors de la connexion [gsi]ssh: LFC server, catalog pour alice, zone pour xrootd, etc.

Durée du proxy

Vérifier dans /opt/lcg/sbin/vobox-renewd qu'on a '-t 48' :

{{{

${GLOBUS_LOCATION}/bin/myproxy-get-delegation -a ${VOBOX_PROXY_REPOSITORY}/${CERT} -d -o $TMP_PROXY -t 48 2>&1 > /dev/null

}}}

Il s'agit d'un problème qui devrait être résolu dans le futur

Backup

Faire régulièrement des sauvegardes de ~alis, /opt/vobox et des logs d'Alien (ex: /var/log/alis)

Se connecter à la VO-BOX depuis le UI

Faire 'gsissh -l user -p port_GSISSH <vobox_name> '

{{{

[diarra@ipngrid01 ~]$ gsissh -l alis -p 1975 ipnvobox

}}}

Utiliser le serveur myproxy

Sur le UI:

{{{

myproxy-init -s myproxy.cern.ch -d -n -t 48 -c 720 gsissh -l alis -p 1975 <vobox_name>

}}}

Sur la VO-BOX:

{{{

vobox-proxy --vo alice --proxy-safe 3600 --myproxy-safe 259200 --email <votre_e-mail> register

}}}

Pour s'assurer que le proxy est renouveler automatiquement, vérifier que vous avez dans /opt/vobox/alice/log/events.log une ligne du genre:

{{{

9/07/06 14:35:56 : Proxy for DN "/O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra/CN=proxy/CN=proxy/CN=proxy" successfully renewed

}}}

Dans /opt/vobox/alice/proxy_repository/ vous trouverez le proxy.

Start/Stop des services

Les services peuvent être démarrés un par un. Les services disponibles sont : Monitor, SE, CE, PackMan, Monalisa.

Un script permet de les démarrer ou de les arrêter dans le bon ordre:

stop

Pour démarrer ou arreter un seul service :

StopServiceName

Exemple: $VO_ALICE_SW_DIR/alien/scripts/lcg/lcgAlien.sh StopCE $VO_ALICE_SW_DIR/alien/scripts/lcg/lcgAlien.sh StartCE


Expiration du proxy

Quand vous recevez un mail indiquant que le proxy est sur le point d'expirer (3 jours avant ?), ou si les logs le signalent, il faut renouveler le proxy sur le serveur myproxy depuis le UI.

{{{

[root@ipnvobox log]# more /opt/vobox/alice/log/events.log ... 11/26/06 15:03:05 : Myproxy lifetime (256228 sec) shorter than security threshol d (259200 sec) 11/26/06 15:03:05 : ... for DN /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diar ra 11/26/06 15:03:05 : sendind notification email to diarra@ipno.in2p3.fr. SUCCESSF ULL

}}}

Sur le UI:

{{{

[diarra@ipnls2011 my]$ myproxy-info -d -s myproxy.cern.ch username: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra owner: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra

 timeleft: 52:25:26  (2.2 days)

[diarra@ipnls2011 my]$ myproxy-init -s myproxy.cern.ch -d -n -t 48 -c 720 Your identity: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra Enter GRID pass phrase for this identity: Creating proxy ............................................ Done Proxy Verify OK Your proxy is valid until: Wed Dec 27 09:56:25 2006 A proxy valid for 720 hours (30.0 days) for user /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra now exists on myproxy.cern.ch.

}}}

Monitoring / Accounting

* ALICE Monitoring with MonALISA
* ALICE Dashboard : Job Summary

Liens Utiles

Debugging & Troubleshooting the ALICE LCG Vo-Box

VO-box HowTo - description, installation, testing

Page Alice LCG-France

VOBOX Security and Operations Questionnaires

Pages sur les VOboxes

LCG VOBox Operations Recommendations and Questionnaire

How to install xrootd on data servers

XROOTD


Test Transfert FTS

Sites impliqués

  • T1 CC-IN2P3
    • Contacts : David Bouvet, Lionel Schwarz
    • SE : ccsrm.in2p3.fr
      • Endpoint transferts DAPNIA-CC : /pnfs/in2p3.fr/data/dteam/disk/dapnia/
  • T2 GRIF
    • Contacts : Michel Jouvin, Pierric Micout, Christine Leroy, Diego Terront
    • SE-DAPNIA : node12.datagrid.cea.fr
      • GlueServiceEndpoint: httpg://node12.datagrid.cea.fr:8443/srm/managerv1
      • GlueSAPath: /dpm/datagrid.cea.fr/home/dteam

conditions de transferts

Les transferts sont initiés depuis node02.datagrid.cea.fr

  • Avant tout transfert, il faut un proxy valide déposé sur un serveur MyProxy pour permettre au serveur FTS de renouveler un proxy expiré en cours de transfert

myproxy-init -s cclcgproxli01.in2p3.fr -d


glite-transfer-channel-list -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement GRIF-IN2P3


glite-transfer-channel-set -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement -f 10 -T 1 GRIF-IN2P3

Les tests de transferts



CC->DAPNIA

set SourceURL="srm://ccsrm.in2p3.fr:8443/"
set DestURL="srm://node12.datagrid.cea.fr:8443/dpm/datagrid.cea.fr/home/dteam/"

liste des fichiers:


srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00007
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00008
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00009
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00011
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00012
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00013
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00014
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00015
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00016
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00017
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00018
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00019

DAPNIA -> CC

set SourceURL="srm://node12.datagrid.cea.fr:8443/dpm/datagrid.cea.fr/home/dteam/dapnia/"
set DestURL="srm://ccsrm.in2p3.fr:8443/pnfs/in2p3.fr/data/dteam/disk/dapnia/"

liste des fichiers

cleroy/ATLAS-file00007
cleroy/ATLAS-file00008
cleroy/ATLAS-file00009
cleroy/ATLAS-file00011
cleroy/ATLAS-file00012
cleroy/ATLAS-file00013
cleroy/ATLAS-file00014
cleroy/ATLAS-file00015
cleroy/ATLAS-file00016
cleroy/ATLAS-file00017
cleroy/ATLAS-file00018
cleroy/ATLAS-file00019


en parrallele avec n=10 pour les 2, pour durer environ 15 minutes (1Gb/s)

ESSAI du nbre de  |
(fichier;stream)  | Bande passante(Mb/s)  | 
------------------+-----------------------+
| (f8;T1)         | 242                   |
| (f6;T1)         | 301                   |
| (f3;T1)         | 302                   |
| (f2;T1)         | 185                   |
| (f6;T2)         | 312                   |
| (f6;T6)         | 284                   |
| (f6;T4)         | 280                   |