CPU-Benches
Transition vers les nouvelles unités specs HEP-SPEC06 -- --Chollet 09:36, 15 juin 2009 (CEST)--
- NEW ! Nouvelle page HEPiX --- https://hepix.caspur.it/benchmarks
- Conversion : 1 kSI2k = 4 HEP-SPEC06
- Document de référence pour la publication dans le contexte actuel (Glue schema 1.3):
https://twiki.cern.ch/twiki/pub/LCG/WLCGCommonComputingReadinessChallenges/WLCG_GlueSchemaUsage-1.8.pdf
Le document permet de se familiariser avec les différents termes utilisés
- PhysicalCPUs = nombre de processeurs c.a.d de chipset
Un subcluster de 113 machines bi processeurs quadricoeurs = 226 CPUs physiques
- LogicalCPUs = nombre de CPUs vus de l'OS égal au nombre de cœurs pour autant que l'hyperthreading ne soit pas activé
Un subcluster de 113 machines bi processeurs quadricoeurs = 904 CPUs logiques Le nombre de coeurs par CPU (par chipset) étant de 4
- Consignes pour les sites / Advices for sites :
Présentation J.Gordon 09/06/09
Tentative de synthèse --Chollet 17:50, 10 septembre 2009 (CEST) - Effectuer la mesure de la capacité CPU de la machine à partir du benchmark HEP-SPEC06 en utilisant le script mis à disposition ci-dessous (ATTENTION l'output du script fournit effectivement un score par machine et la publication se fait par cœur) - Publier la capacité par cœur en HEP-SPEC06 et le nombre de cœurs par CPU (=chipset) via GlueHostProcessorOtherDescription: Benchmark=<value>-HEP-SPEC06 Cet attribut est également utilisé pour publier le nombre de cœurs par CPU (=chipset) GlueHostProcessorOtherDescription: Cores=<typical number of cores per CPU>,Benchmark=<value>-HEP-SPEC06 - Convertir la capacité CPU par coeur en SI2K en mulipliant par 250 - Mettre à jour l'attribut GlueHostBenchmarkSI00 En cas de clusteur ou sous-clusteur hétérogène, GlueHostBenchmarkSI00 étant défini comme "Average SpecInt2000 rating per logical CPU" c.a.d par coeur pourvu que l'hyperthreading soit désactivé, vous êtes invités à effectuer à publier une valeur moyenne.
- LCG Overview Board - Change of CPU accounting unit (I.Bird):
The working group on benchmarking has now concluded, both on the new benchmark and on the transition process from SI2K. A new benchmark, based on the SPEC 2006 suite has been agreed upon. This uses a combination of the SPEC2006 FP and INT benchmarks, and has been shown to scale well with the experiments’ applications. This benchmark, labelled HEP-SPEC06, will be used in future to specify requirements and resources. There is an agreement to use a simple conversion factor of 4 representing the benchmarks ratio HEP-SPEC06/kSI2K. Sites will be requested to benchmark their existing resources, and the results will be published on a web site. Future procurements should require the vendor to run the benchmark – provided as a simple script. Planning for changing the reporting in the accounting system is under way. The new unit will be used in the April RRB.
- Décision du MB du 27 janvier
https://twiki.cern.ch/twiki/pub/LCG/MbMeetingsMinutes/LCG_Management_Board_2009_01_27.htm s'appuyant sur la proposition du groupe technique (G.Merino)
- Le script dispo à https://twiki.cern.ch/twiki/bin/view/FIOgroup/TsiBenchHEPSPEC (Voir les attachements en bas de page tar.gz)
- La distribution de la suite SPEC CPU2006 version 1.1 est disponible (sous AFS au CC).
Pour plus d'infos contacter F.Chollet ou Pierre Larrieu
SPEC CPU2000 Des tests de puissance des CPU ont été réalisés au LAPP (Eric Fede) et à Subatech (Jean-Michel Barbet) avec la suite SPEC CPU2000 suivant la méthodologie recommandée : http://hepix.caspur.it/processors/ Ajout des tests au CPPM (Edith Knoops)
SPEC HEP Des mesures avec la benchmark suite HEP SPEC sont également disponibles ( fond bleu des tableaux)
Tests réalisés par Jean-Michel :
Scientific-Linux V4.3 i386, gcc v3.4.5
Les autres conditions de test sont disponibles sur demande. A noter que les tests ont été réalisés sur des machines en configuration opérationnelles pour la grille (avec tous les daemons).
Machine | CPU | Nb cores | Mémoire RAM | CERN SI2K/core [1] | FZK SI2K/core [3] | CERN SI2K/core corrigé [2] | SPEC HEP 32bits/machine [4] | SPEC HEP 64bits/machine [4] |
---|---|---|---|---|---|---|---|---|
Dell PE1955 | Woodcrest 5160 3.00GHz | 4 | 8Go | 1409 | 1830 | 2113 | 39.48 | - |
Dell P21950 | Clovertown E5420 2.50GHz | 8 | 16Go | - | - | - | 63.18 | 57.63 |
IBM | Clovertown 2.33GHz | 8 | 16Go | 979 | 1875 | 1468 | 53.12 | - |
Dell Optiplex | Pentium4 3.20GHz | 1 | 2Go | 872 | 1128 | 1308 | - | - |
Dell PowerEdge 1955 Woodcrest 5160 : http://www.spec.org/osg/cpu2000/results/res2006q3/cpu2000-20060626-06298.html
Dell PowerEdge 1950 Clovertown E5420 :
IBM 3550 Woodcrest 5160 : http://www.spec.org/osg/cpu2000/results/res2006q3/cpu2000-20060623-06219.html
IBM 3350 Clovertown E5345 : http://www.spec.org/osg/cpu2000/results/res2006q4/cpu2000-20061113-07918.html
Tests réalisés au LAPP (eric) :
Scientific-Linux V3.08 i386, gcc v3.4.3
A noter que les tests ont été réalisés sur des machines dont tous les services non nécéssaires étaient desactivés
Machine | CPU | Nb cores | Mémoire RAM | CERN SI2K/core [1] | FZK SI2K/core [3] | CERN SI2K/core corrigé [2] |
---|---|---|---|---|---|---|
HP BL 460c | Woodcrest 2.66GHz | 4 | 8Go | 1367 | 1665 | 2050 |
Scientific-Linux V4.5 x86_64, gcc v3.4
A noter que les tests ont été réalisés sur des machines dont tous les services non nécéssaires étaient desactivés. Un tuning "simple" au niveau du bios donne des disparités dans les résultats des bench qui depassent les 10 %.
Machine | CPU | Nb cores | Mémoire RAM | CERN SI2K/core [1] | FZK SI2K/core [3] | CERN SI2K/core corrigé [2] | SPEC HEP 32bits [4] per machin | SPEC HEP 64bits [4] per machin |
---|---|---|---|---|---|---|---|---|
HP BL 460c | Woodcrest 2.66GHz | 4 | 8Go | 1485 | 1592 | 2227 | 36.58 | 34.6 |
HP BL 460c | Clovertown 2.33GHz | 8 | 16Go | 1225 | x | 1837 | 56.04 | 51.18 |
DELL 1950 | Intel 5335 2GHz | 8 | 8Go | 1060 | 1139 | 1590 | x | x |
HP BL 460c | Harpertown 3GHz | 8 | 16Go | 1620 | 1715 | 2430 | 70.83 | 63.99 |
DELL M600 | Harpertown 2.66GHz | 8 | 32Go | 1481 | 1588 | 2221 | x | x |
[1] : Moyenne de 3 exécutions successives avec les optimisations CERN, chaque exécution démarrant un benchmark CPU2000 par CPU core.
[2] : Correction : La valeur moyenne ci-dessus + 50%. C'est la valeur à publier via le système d'information de la grille.
[3] : Une exécution unique avec les optimisations FZK à titre indicatif.
[4] : Benchmark suite HEP SPEC, en suivant les recommandations : https://twiki.cern.ch/twiki/bin/view/FIOgroup//TsiBenchHEPSPEC
Tests réalisés au CPPM (Edith) :
Scientific-Linux 4.6 x86_64, gcc v3.4.6
A noter que les tests ont été réalisés sur des machines dont tous les services non nécéssaires étaient desactivés
Machine | CPU | Nb cores | Mémoire RAM | CERN SI2K/core | FZK SI2K/core | CERN32 SI2K/core | CERN SI2K/core corrigé |
---|---|---|---|---|---|---|---|
HP DL145 | Opteron 250 2.4Ghz | 2 | 4Go | 1149 | 1278 | 972 | 1725 |
SUN | Opteron 250 2.4Ghz | 2 | 4Go | 1173 | 1298 | 988 | 1760 |
HP DL145G2 | Opteron 275 2.2 Ghz | 4 | 6Go | 981 | 1087 | 857 | 1471 |
DELL | Opteron 2218 2.6 Ghz | 4 | 8Go | 1199 | 1073 | 1045 | 1798 |
DELL | Xeon E5420 2.5Ghz | 8 | 16 Go | 1418 | 1528 | x | 2128 |
Tests réalisés à l'IPHC (Jérôme) :
Scientific-Linux 4.6 x86_64, gcc v3.4.6
Pour la réalisation de ces tests, seuls les services indispensables étaient activés.
Machine | CPU | Nb cores | Mémoire RAM | CERN SI2K/core | FZK SI2K/core | CERN SI2K/core corrigé | SPEC HEP 32bits [1] per machin |
---|---|---|---|---|---|---|---|
DELL M600 | Xeon E5410 2.33Ghz | 8 | 16Go | N/A | N/A | N/A | 61.05 |
[1] Moyenne des résultats obtenus sur quatre tests.