|
Der Benchmark muss mit GROMACS 4.5 durchgeführt werden. Zur Installation wird eine FFT-Bibliothek (z.B. FFTW 3.2) in einfacher Genauigkeit benötigt. Allgemeine Installationshinweise sind auf www.gromacs.org verfügbar.
Konfiguration mit automake:
export LDFLAGS=-L/path/to/fftw/lib
export CPPFLAGS=-I/path/to/fftw/include
export CC=gcc
./configure --prefix=/path/to/gromacs-install --enable-threads --disable-shared
make ; make install
Alternativ: Konfiguration mit Cmake:
mkdir build
cd build
cmake .. \
-DBUILD_SHARED_LIBS=OFF \
-DFFTW3F_LIBRARIES=/path/to/fftw/lib/libfftw3f.a \
-DFFTW3F_INCLUDE_DIR=/path/to/fftw/include \
-DCMAKE_INSTALL_PREFIX=/path/to/gromacs-install \
-DGMX_THREADS=ON -DGMX_MPI=OFF \
-DCMAKE_C_COMPILER=/usr/bin/gcc
make ; make install
Durchführen des Benchmarks
Die Durchführung des Benchmarks geschieht mit folgenden Aufrufen:
source /path/to/gromacs-install/bin/GMXRC
export MDRUN=`which mdrun`
g_tune_pme -nt <NCORES> -s Aquaporin_gmx4.tpr -ntpr 1
Eine Benchmark-Simulation dauert einige Minuten. Am Ende der Bildschirmausabe sowie in der Ausgabedatei "perf.out" kann die bestmögliche Performance für die getestete Anzahl an Cores in simulierter Zeit pro Tag (ns/day) abgelesen werden.
Wir weisen darauf hin, dass auf großen Zahlen von Cores (48 und mehr) das dynamische load balancing von Gromacs einige hundert Zeitschritte brauchen kann, bis die Last optimal über die Prozesse (Cores) verteilt ist. Für diese Fälle kann mit den zusätzlichen Switches -resetstep 5000 -steps 5000 die Benchmark-Laufzeit (und damit die Genauigkeit des Messergebnisses der Performance) erhöht werden (hier z.B. auf 5000 Schritte), allerdings auf Kosten einer längeren Benchmark-Dauer.
|