Go to file
gabrielkheisa 3e20acbbc7 add zip
2022-11-27 14:30:10 +07:00
.slurm-16608.out.swp hasil 2022-11-27 13:51:45 +07:00
a.out hasil 2022-11-27 13:51:45 +07:00
Gabriel-Possenti_19123_TugasTuning.zip add zip 2022-11-27 14:30:10 +07:00
hasil-parallel.out hasil 2022-11-27 13:51:45 +07:00
hasil-serial.out hasil 2022-11-27 13:51:45 +07:00
readme.md readme 2022-11-27 14:23:46 +07:00
script-parallel.sh fix 2022-11-27 13:44:28 +07:00
script-serial.sh fix 2022-11-27 13:44:28 +07:00
tugas-parallel.f add 2022-11-27 13:36:20 +07:00
tugas-serial.f add 2022-11-27 13:36:20 +07:00

Gabriel Possenti Kheisa Drianasta
19/442374/PA/19123

Hasil Performance tuning

Sebelum parallel

mahasiswa2
komputasi06
  mimax=         129  mjmax=          65  mkmax=          65
  imax=         128  jmax=          64  kmax=          64
  Start rehearsal measurement process.
  Measure the performance in 10000 times.
   MFLOPS:   724.292114       time(s):   227.362640       8.79942896E-10

Sesudah parallel

mahasiswa2
komputasi06
  mimax=         129  mjmax=          65  mkmax=          65
  imax=         128  jmax=          64  kmax=          64
  Start rehearsal measurement process.
  Measure the performance in 10000 times.
   MFLOPS:   6017.17725       time(s):   27.3678112       8.79942896E-10

Pembahasan

Program OMP do end do disispkan pada bagian berikut pada program himeno:

1f11c63307

Kemudian dilanjutkan dengan penambahan $OMP parallel private() dan do reduction untuk deklarasi variabel parallel:

8babfcc27e

Hasilnya adalah peningkatan performa dari 724MFLOPS menjadi 6017MFLOPS atau sebesar 8.3 kali untuk 20 threads


Lampiran source code dan dokumentasi: https://repo.gabrielkheisa.xyz/gabrielkheisa/tugas3-openMP/src/branch/master2