Difference between revisions of "User talk:LEROY"
(→Les tests de transferts) |
(→conditions de transferts) |
||
Ligne 258: | Ligne 258: | ||
* Avant tout transfert, il faut un '''proxy valide déposé sur un serveur MyProxy''' pour permettre au serveur FTS de renouveler un proxy expiré en cours de transfert | * Avant tout transfert, il faut un '''proxy valide déposé sur un serveur MyProxy''' pour permettre au serveur FTS de renouveler un proxy expiré en cours de transfert | ||
− | myproxy-init -s cclcgproxli01.in2p3.fr -d | + | myproxy-init -s cclcgproxli01.in2p3.fr -d |
* [[pour connaitre la configuration du canal FTS :]] | * [[pour connaitre la configuration du canal FTS :]] | ||
− | glite-transfer-channel-list -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement GRIF-IN2P3 | + | glite-transfer-channel-list -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement GRIF-IN2P3 |
Version du 14:44, 26 avril 2007
Sommaire
- 1 Installation et Configuration d'une VO-BOX ALICE
- 1.1 Introduction
- 1.2 Ressources disques requises
- 1.3 Les ports à ouvrir pour la VO-BOX au niveau du router
- 1.4 Le profile de la VO-BOX sous Quattor
- 1.5 Après l'installation via Quattor de la machine
- 1.6 Durée du proxy
- 1.7 Backup
- 1.8 Se connecter à la VO-BOX depuis le UI
- 1.9 Utiliser le serveur myproxy
- 1.10 Start/Stop des services
- 1.11 Expiration du proxy
- 1.12 Monitoring / Accounting
- 1.13 Liens Utiles
- 2 Test Transfert FTS
Installation et Configuration d'une VO-BOX ALICE
Introduction
Un site grille qui souhaite supporter l'expérience ALICE, doit installer une VO-BOX. ALICE utilise AliEN (Alice ENvironment) comme plateforme logicielle pour la simulation et l'analyse des données. Alien est installé sur chaque VO-BOX. C'est le CE d'Alien qui soumet les Job Agents (JAs) au CE du site. Les JAs vont ensuite chercher les jobs dans central Task Queue de Alien. Les jobs écrivent via xrootd (directement vers le CERN pour le moment). Comme il n'y a pas encore d'interface xrootd/SRM, chaque VO-BOX doit fournir un stockage xrootd qui peut être sur un disque local.
Les documents à lire impérativement (en plus de ce guide) sont:
* ALICE LCG VO-Box Installation Guide * VOBOX Security and Operations Questionnaires
La VO-BOX n'est pas consommatrice en CPU et RAM. N'importe quel PC récent(Pentium+) avec 2GB+ de RAM peut faire l'affaire. Cependant un bon hardware est recommandé pour minimiser la fréquence des pannes.
Ressources disques requises
* Partition / (root) : au moins 2 GB * Partition /var : y prévoir 10-15 GB d'espace pour les logs d'Alien * /data (ou un autre nom) : partition local pour xrootd (prévoir 3G par job slot)
Remarques:
1. xrootd: sur un site avec plus de 30 job slots, passer si possible au mode "head node + xrootd servers" pour des raisons de performances 2. "/home" doit être local pour des raisons de performances et de gestion des "locks"
Les ports à ouvrir pour la VO-BOX au niveau du router
* 1975/tcp (gsissh): inbound from 137.138.0.0/16 and 192.16.186.192/26 * 1094/tcp(xrootd) * 8082/tcp (Storage Adapter) * 8083 (FTD) * 8084/tcp (Site Proxy) * 9991/tcp (PackMan) : Inbound from 137.138.0.0/16 * 1093/tcp (proofd)
Le profile de la VO-BOX sous Quattor
Dans clusters/<nom_site>-glite-x.y.z/profiles/profile_<nom_vobox>.tpl, faire:
{{{
include pro_<nom_site>_alice_glite_vobox; (voir cfg/clusters/ipno-glite-3.0.0/profiles/profile_ipnvobox.tpl)
}}}
Dans sites/<nom_site>/machine-types, créer pro_<nom_site>_alice_glite_vobox.tpl et pro_<nom_site>_alice_vobox_config.tpl
Vous pouvez copier et adpater les templates de l'IPNO ou du DAPNIA.
Après l'installation via Quattor de la machine
* Demander et installer le certificat serveur GRID-FR de la mchine * Vérifier que les utilisateurs alis et alip existent dans /etc/passwd * Verifier que Patricia Lorenzo Mendez et Artem Trunov sont bien mappés sur alis dans /etc/grid-security/grid-mapfile et qu'il y a quelqu'un mappé sur alip. Question ouverte: faut-il creer les pool accounts ? Ou faut-il créer uniqument les comptes alis, alip nécessaires pour ALICE ? * Dans /etc/shadow vous devez avoir '*' dans le champ 'password', sinon le logingsissh ne marchera pas. Donc il faut remplacer '!!' ou '!*NP*' par '*' {{{
[root@ipnvobox etc]# grep alis /etc/shadow alis:*:13574:0:99999:7:::
}}} * Vérifier que le serveur GSISSH tourne sur la VOBOX sur le port 1975. * Vérifier que $MYPROXY_SERVER pointe bien sur myproxy.cern.ch * Vérifier que la expérimental software area ($VO_ALICE_SW_DIR) est bien accessible via NFS depuis la VO-BOX et writeable par alis. Il faut au moins 5GB d'espace libre pour le soft d'ALICE. * Vérifier que la partition /data pour xrootd existe et appartient à alis (/data doit être crée sous Quattor ou à la main) {{{
[root@ipnvobox root]# ls -ld /data drwxr-xr-x 19 alis alice 4096 Dec 14 13:22 /data
}}} * Créer un directory pour les logs d'Alien (ex: /var/log/alis). Il doit appartenir à alis et nécessite 10-15 GB libre. {{{
[root@ipnvobox root]# ls -ld /var/log/alis drwxrwxrwx 10 alis alice 4096 Mar 2 16:54 /var/log/alis
}}} * Configurer le proxy-renewal service. MAIS, le script /opt/vobox/templates/voname-box-proxyrenewal n'est pas encore exécuté automatiquement. Cal a prévu de corriger le probleme. Donc si après l'installation de la VO-BOX, il manque alice-box-proxyrenewal dans /etc/cron.d/ et dans /etc/init.d/ ainsi que start, stop, agents et info-provider dans /opt/vobox/alice/, alors faire: 1. créer /etc/cron.d/alice-box-proxyrenewal: {{{
[root@ipnvobox root]# cat /etc/cron.d/alice-box-proxyrenewal
- !/bin/sh
20 2,8,14,20 * * * root (PATH=/sbin:/bin:/usr/sbin:/usr/bin; /sbin/service alice-box-proxyrenewal proxy)
}}} 2. copier /opt/vobox/templates/voname-box-proxyrenewal dans /tmp/alice-proxy-renewal.sh, adpatez-le et exécutez-le (le script que j'ai utilisé est en attachement: alice-proxy-renewal.sh). 3. vous devez alors retrouver les directories qui manquaient: {{{
[root@ipnvobox alice]# ls -l total 44 drwx------ 2 alis alice 4096 Jul 19 2006 agents -rw-rw-rw- 1 alis alice 0 Nov 14 09:09 edglog.log drwx------ 2 alis alice 4096 Jul 19 2006 info-provider drwx------ 2 alis alice 4096 Mar 1 04:02 log drwx------ 2 alis alice 4096 Mar 2 17:19 proxy_repository -rw------- 1 alis alice 13750 Mar 2 17:04 _registerer_proxies.db -r-------- 1 alis alice 2690 Mar 2 14:20 renewal-proxy.pem drwx------ 2 alis alice 4096 Aug 6 2006 start drwx------ 2 alis alice 4096 Aug 5 2006 stop
}}} * Envoyer un e-mail à: Patricia.Mendez@cern.ch, latchezar.betev@cern.ch et trunov@cc.in2p3.fr :
1. demander que la machine soit enregistrée 'as trusted host' dans myproxy.cern.ch dans LDAP (il faut fournir le DN de la VOBOX). 2. fournir les informations suivantes dans le mail:
* hostname de la VO-BOX * le nom des users: alicesgm (alis dans GRIF), alip (ALICE Production) * le nom directory pour xrootd (ex: /data) * le nom du SE/DPM Server (ex: ipnsedpm.in2p3.fr) * le nom du serveur LFC (ex: grid14.lal.in2p3.fr) et le catalogue pour ALICE (/grid/alice) * le nom du RB (ex: grid09.lal.in2p3.fr) * le nom du CE et de la queue batch (ex: ipnls2001.in2p3.fr:2119/jobmanager-pbs-alice) * le path pour le experiment software area (ex:VO_ALICE_SW_DIR=/ipn/storage1/exp_soft/alis, zone "NFS shared" avec les WNs) * Installer Alien ou demander que Artem ou Patricia vous l'installe. * S'inscrire individullement dans le projet ALICE (voir avec un physicien d'ALICE du Labo et avec le Secrétariat d'ALICE) : 1. demander un logon au CERN (si vous n'en avez pas déjà) 2. demander à être enregistré comme membre du projet ALICE * Inscrivez-vous dans AliEn en suivant les étapes sur la page http://alien.cern.ch/twiki/bin/view/Alice/UserRegistration 1. Vous serez amenés à vous inscrire dans la VO ALICE (si ce n'est pas déjà fait) sur https://lcg-voms.cern.ch:8443/vo/alice/vomrs 2. Ensuite vous pourrez vous inscrire dans AliEn ("5. Register with AliEn" sur https://alien.cern.ch:8443/twiki/bin/UserReg * Demander ensuite à être mapé sur 'alidprod' si vous voulez pouvoir utiliser AliEn sous votre nom (ALIEN_USER=user_name dans ~alis/.alien/Environment) la VO-BOX (start/stop des services par exemples) * Mettre dans /etc/motd des informations utiles à afficher lors de la connexion [gsi]ssh: LFC server, catalog pour alice, zone pour xrootd, etc.
Durée du proxy
Vérifier dans /opt/lcg/sbin/vobox-renewd qu'on a '-t 48' :
{{{
${GLOBUS_LOCATION}/bin/myproxy-get-delegation -a ${VOBOX_PROXY_REPOSITORY}/${CERT} -d -o $TMP_PROXY -t 48 2>&1 > /dev/null
}}}
Il s'agit d'un problème qui devrait être résolu dans le futur
Backup
Faire régulièrement des sauvegardes de ~alis, /opt/vobox et des logs d'Alien (ex: /var/log/alis)
Se connecter à la VO-BOX depuis le UI
Faire 'gsissh -l user -p port_GSISSH <vobox_name> '
{{{
[diarra@ipngrid01 ~]$ gsissh -l alis -p 1975 ipnvobox
}}}
Utiliser le serveur myproxy
Sur le UI:
{{{
myproxy-init -s myproxy.cern.ch -d -n -t 48 -c 720 gsissh -l alis -p 1975 <vobox_name>
}}}
Sur la VO-BOX:
{{{
vobox-proxy --vo alice --proxy-safe 3600 --myproxy-safe 259200 --email <votre_e-mail> register
}}}
Pour s'assurer que le proxy est renouveler automatiquement, vérifier que vous avez dans /opt/vobox/alice/log/events.log une ligne du genre:
{{{
9/07/06 14:35:56 : Proxy for DN "/O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra/CN=proxy/CN=proxy/CN=proxy" successfully renewed
}}}
Dans /opt/vobox/alice/proxy_repository/ vous trouverez le proxy.
Start/Stop des services
Les services peuvent être démarrés un par un. Les services disponibles sont : Monitor, SE, CE, PackMan, Monalisa.
Un script permet de les démarrer ou de les arrêter dans le bon ordre:
stop
Pour démarrer ou arreter un seul service :
StopServiceName
Exemple: $VO_ALICE_SW_DIR/alien/scripts/lcg/lcgAlien.sh StopCE $VO_ALICE_SW_DIR/alien/scripts/lcg/lcgAlien.sh StartCE
Expiration du proxy
Quand vous recevez un mail indiquant que le proxy est sur le point d'expirer (3 jours avant ?), ou si les logs le signalent, il faut renouveler le proxy sur le serveur myproxy depuis le UI.
{{{
[root@ipnvobox log]# more /opt/vobox/alice/log/events.log ... 11/26/06 15:03:05 : Myproxy lifetime (256228 sec) shorter than security threshol d (259200 sec) 11/26/06 15:03:05 : ... for DN /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diar ra 11/26/06 15:03:05 : sendind notification email to diarra@ipno.in2p3.fr. SUCCESSF ULL
}}}
Sur le UI:
{{{
[diarra@ipnls2011 my]$ myproxy-info -d -s myproxy.cern.ch username: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra owner: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra
timeleft: 52:25:26 (2.2 days)
[diarra@ipnls2011 my]$ myproxy-init -s myproxy.cern.ch -d -n -t 48 -c 720 Your identity: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra Enter GRID pass phrase for this identity: Creating proxy ............................................ Done Proxy Verify OK Your proxy is valid until: Wed Dec 27 09:56:25 2006 A proxy valid for 720 hours (30.0 days) for user /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra now exists on myproxy.cern.ch.
}}}
Monitoring / Accounting
* ALICE Monitoring with MonALISA * ALICE Dashboard : Job Summary
Liens Utiles
Debugging & Troubleshooting the ALICE LCG Vo-Box
VO-box HowTo - description, installation, testing
VOBOX Security and Operations Questionnaires
LCG VOBox Operations Recommendations and Questionnaire
How to install xrootd on data servers
Test Transfert FTS
Sites impliqués
- T1 CC-IN2P3
- Contacts : David Bouvet, Lionel Schwarz
- SE : ccsrm.in2p3.fr
- Endpoint transferts DAPNIA-CC : /pnfs/in2p3.fr/data/dteam/disk/dapnia/
- T2 GRIF
- Contacts : Michel Jouvin, Pierric Micout, Christine Leroy, Diego Terront
- SE-DAPNIA : node12.datagrid.cea.fr
- GlueServiceEndpoint: httpg://node12.datagrid.cea.fr:8443/srm/managerv1
- GlueSAPath: /dpm/datagrid.cea.fr/home/dteam
conditions de transferts
Les transferts sont initiés depuis node02.datagrid.cea.fr
- Avant tout transfert, il faut un proxy valide déposé sur un serveur MyProxy pour permettre au serveur FTS de renouveler un proxy expiré en cours de transfert
myproxy-init -s cclcgproxli01.in2p3.fr -d
glite-transfer-channel-list -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement GRIF-IN2P3
glite-transfer-channel-set -s https://cclcgftsprod01.in2p3.fr:8443/glite-data-transfer-fts/services/ChannelManagement -f 10 -T 1 GRIF-IN2P3
Les tests de transferts
- Script python proposé par Sabine Elles pour lancer des commandes de transfert(globus-url-copy, srmcp, lcg_cp, ...) sous forme de threads : http://lappweb.in2p3.fr/informatique/GRID/transfert_concurrent.tar.gz
- Script de test des transferts FTS proposé par GridPP à l'adresse : http://www.gridpp.ac.uk/wiki/Transfer_Test_Python_Script_HOWTO
- Le wiki GriPP est une mine d'informations : http://www.gridpp.ac.uk/wiki/Main_Page
CC->DAPNIA
set SourceURL="srm://ccsrm.in2p3.fr:8443/" set DestURL="srm://node12.datagrid.cea.fr:8443/dpm/datagrid.cea.fr/home/dteam/"
liste des fichiers:
srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00007 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00008 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00009 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00011 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00012 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00013 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00014 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00015 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00016 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00017 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00018 srm/managerv1?SFN=/pnfs/in2p3.fr/data/dteam/dapnia/cleroy/ATLAS-file00019
DAPNIA -> CC
set SourceURL="srm://node12.datagrid.cea.fr:8443/dpm/datagrid.cea.fr/home/dteam/dapnia/" set DestURL="srm://ccsrm.in2p3.fr:8443/pnfs/in2p3.fr/data/dteam/disk/dapnia/"
liste des fichiers
cleroy/ATLAS-file00007 cleroy/ATLAS-file00008 cleroy/ATLAS-file00009 cleroy/ATLAS-file00011 cleroy/ATLAS-file00012 cleroy/ATLAS-file00013 cleroy/ATLAS-file00014 cleroy/ATLAS-file00015 cleroy/ATLAS-file00016 cleroy/ATLAS-file00017 cleroy/ATLAS-file00018 cleroy/ATLAS-file00019
en parrallele avec n=10 pour les 2, pour durer environ 15 minutes (1Gb/s)
ESSAI du nbre de | (fichier;stream) | Bande passante(Mb/s) | ------------------+-----------------------+ | (f8;T1) | 242 | | (f6;T1) | 301 | | (f3;T1) | 302 | | (f2;T1) | 185 | | (f6;T2) | 312 | | (f6;T6) | 284 | | (f6;T4) | 280 |