Difference between revisions of "MultiCoreAccounting"

Un article de lcgwiki.
Jump to: navigation, search
Ligne 14: Ligne 14:
 
* 2- F. Schaer doit forcer une nouvelle publication
 
* 2- F. Schaer doit forcer une nouvelle publication
  
= Etape 1 (info de Frédéric Schaer)=
+
=== Etape 1===
 +
(info de Frédéric Schaer)
 +
 
 
Pour forcer un reparsing il faut modifier la database sur node56 directement, ce que peut faire chaque site pour ses machines.
 
Pour forcer un reparsing il faut modifier la database sur node56 directement, ce que peut faire chaque site pour ses machines.
  
Ligne 30: Ligne 32:
 
mysql> explain delete from ProcessedFiles where filename like '%201411%';
 
mysql> explain delete from ProcessedFiles where filename like '%201411%';
  
= Etape 2 =  
+
=== Etape 2 ===
 
MAIS : le reparsing n'est pas suffisant, il faut ensuite que que F. Schaer force une republication, et pour cela il faut lui dire quels mois republier (i.e : la publication va forcer le joint sur les fichiers reparsés)
 
MAIS : le reparsing n'est pas suffisant, il faut ensuite que que F. Schaer force une republication, et pour cela il faut lui dire quels mois republier (i.e : la publication va forcer le joint sur les fichiers reparsés)
  
Ligne 39: Ligne 41:
 
=== Questions ouvertes ===
 
=== Questions ouvertes ===
 
Q (Edith Knoops) - Si on met  reparse = true dans /etc/apel/parser.config  cela va pas tout reparser ?
 
Q (Edith Knoops) - Si on met  reparse = true dans /etc/apel/parser.config  cela va pas tout reparser ?
 +
 
R (Fred. Schaer) - Je le crains, mais comme la doc n'existe pas... donc à éviter !
 
R (Fred. Schaer) - Je le crains, mais comme la doc n'existe pas... donc à éviter !
 +
  
 
Q (Edith Knoops) - Il faut aussi voir dans ce cas de ne pas reparser depuis mathusalem.
 
Q (Edith Knoops) - Il faut aussi voir dans ce cas de ne pas reparser depuis mathusalem.
 +
 
R (Fred. Schaer) - oui, à voir
 
R (Fred. Schaer) - oui, à voir
 +
  
 
Q (Edith Knoops) - il faut reparser uniquement le scheduler ou aussi les creams ? Dans mon  
 
Q (Edith Knoops) - il faut reparser uniquement le scheduler ou aussi les creams ? Dans mon  
 
cas les 2 creams ont du multicoeurs et utilise un scheduler unique.
 
cas les 2 creams ont du multicoeurs et utilise un scheduler unique.
 +
 
R (Fred. Schaer) - à voir
 
R (Fred. Schaer) - à voir
  

Version du 17:13, 27 novembre 2014

Multicore Deployment

Accounting: Publishing multicore accounting to APEL works. ARC CEs publish correctly. For CREAM CEs to make it work it has to be an EMI-3 CE and it has to be enabled in the configuration.

Edit /etc/apel/parser.cfg and set the attribute parallel=true.

If the site was running multicore already, before upgrading and/or applying this modification, they need to reparse and republish the corrected accounts.

Mise en place de la solution

Une fois avoir corriger l'attribut sur les CREAM_CE (parallel=true), il faut reparser et republier les comptes. La solution vient en deux étapes :

  • 1- les sites doivent reparser leur accounting
  • 2- F. Schaer doit forcer une nouvelle publication

Etape 1

(info de Frédéric Schaer)

Pour forcer un reparsing il faut modifier la database sur node56 directement, ce que peut faire chaque site pour ses machines.

Donc pour le CPPM comme exemple :

mysql> select * from ProcessedFiles where filename like '%20141111%' limit 5 ; Mysql.png

Si le CPPM voulait reparser /var/torque/server_priv/accounting/20141111 et ce *uniquement* pour marsched, alors il devrait faire un truc du genre :

mysql> explain delete from ProcessedFiles where HostName='marsched.in2p3.fr' and filename like '%20141111%';

Si le CPPM veut forcer le reparsing de l'ensemble du mois et pour toutes ses machines, alors :

mysql> explain delete from ProcessedFiles where filename like '%201411%';

Etape 2

MAIS : le reparsing n'est pas suffisant, il faut ensuite que que F. Schaer force une republication, et pour cela il faut lui dire quels mois republier (i.e : la publication va forcer le joint sur les fichiers reparsés)

A noter : Frédéric doit faire un fichier de config spécifique par site (ça n'utilise pas d'arguments CLLI), et lancer un process apel sur chacun de ces fichiers. Comme chaque site n'a pas les même dates, Frédéric doit faire cette manipulation à la main.

Questions ouvertes

Q (Edith Knoops) - Si on met reparse = true dans /etc/apel/parser.config cela va pas tout reparser ?

R (Fred. Schaer) - Je le crains, mais comme la doc n'existe pas... donc à éviter !


Q (Edith Knoops) - Il faut aussi voir dans ce cas de ne pas reparser depuis mathusalem.

R (Fred. Schaer) - oui, à voir


Q (Edith Knoops) - il faut reparser uniquement le scheduler ou aussi les creams ? Dans mon cas les 2 creams ont du multicoeurs et utilise un scheduler unique.

R (Fred. Schaer) - à voir


Sites affectés :

  • CPPM (depuis le 29 septembre)
  • IPHC ("peu d'impact")
  • LAPP (depuis)
  • LPC ("peu d'impact")
  • LPSC (depuis le 1 octobre)