AMD Ungkap Rahasia di Balik Performa Ekstrem ExaFLOPS El Capitan

Dimas Galih Windudjati

Para ilmuwan AMD baru-baru ini mempublikasikan penelitian mereka tentang pengembangan prosesor masa depan untuk komputasi heterogen exascale (exascale heterogeneous processing). Prosesor MI300A adalah jantung dari El Capitan, superkomputer yang diperkirakan menjadi yang tercepat di dunia saat mulai beroperasi tahun ini. El Capitan diproyeksikan mampu berjalan pada kecepatan 2 exaFLOPS.

Penelitian ini melibatkan 13 ilmuwan AMD yang bekerja sama untuk mencapai performa exaFLOPS. Keberadaan MI300A sendiri sebenarnya sudah diumumkan pada Mei 2023. Namun, penelitian terbaru yang dipresentasikan di ISCA 2024 ini memberikan gambaran yang lebih jelas tentang pendekatan AMD dalam memilih APU daripada GPU khusus untuk komputasi exascale.

Lahirnya Instinct MI300A berawal dari keterlibatan AMD dalam proyek penelitian superkomputer Departemen Energi Amerika Serikat (DoE) lebih dari satu dekade lalu. DoE menginginkan superkomputer yang mampu berjalan pada kecepatan exaflop, tetapi dengan berakhirnya Hukum Moore, inovasi yang lebih mendasar diperlukan. Meskipun kuat, AMD merasa bahwa kartu grafis terpisah akan membutuhkan terlalu banyak ruang dan daya, sehingga kurang scalable untuk mencapai exascale. Oleh karena itu, mereka memulai penelitian pada “Prosesor Heterogen Exascale” (Exascale Heterogeneous Processor – EHP).

Proyek EHP berfokus pada pengembangan APU perusahaan yang kuat dan dapat disinkronkan dengan beberapa salinan lainnya. Hasil awal EHP terlihat pada Frontier, superkomputer pertama di dunia yang mencapai 1 exaFLOPS.

Namun, Frontier belum sepenuhnya mewujudkan rencana EHP AMD. Frontier menggunakan hasil penelitian EHP, tetapi masih menggunakan akselerator grafis MI250X khusus alih-alih solusi APU all-in-one yang diharapkan AMD. Hal ini dilakukan agar Frontier dapat selesai tepat waktu, karena teknologi stacking V-Cache AMD saat itu belum sepenuhnya matang.

Teknologi 3D V-Cache akhirnya menjadi terobosan dan EHP siap untuk tahap akhir. APU baru ini didasarkan pada arsitektur CPU prosesor EPYC yang ada di Frontier. Dengan bus memori Infinity Fabric terpadu, MI300A akhirnya dapat mencapai transfer data antar inti grafis dan prosesornya dengan kecepatan TB/s.

MI300A, sebagai wujud akhir Proyek EHP, sangatlah kuat. APU ini memiliki 24 core CPU Zen 4 x86 dalam tiga chiplet, bersama dengan 228 unit komputasi GPU CDNA 3, dan memori HBM3 terpadu 128 GB yang berjalan pada 5,2 GT/s. Semua ini terintegrasi dalam arsitektur Infinity generasi ke-4. Spesifikasinya terlihat luar biasa, dengan bandwidth memori puncak 5,3 TB/s dan performa AI puncak teoritis 3922 TFLOPS.

Performa GPU pada APU MI300A meningkat secara substansial dibandingkan dengan performa GPU khusus MI250X di Frontier. Dalam pengujian benchmark sintetis beban kerja HPC, MI300A menunjukkan hasil 1,25x hingga 2,75x lebih cepat daripada MI250X. Peningkatan performa rata-rata ini membuktikan bahwa AMD dan Departemen Energi Amerika Serikat mengambil keputusan yang tepat dengan mengejar konsep EHP.

MI300A dirancang untuk digunakan dalam susunan empat APU. Setiap APU memiliki delapan interface Infinity Fabric 128 GB/s, menghasilkan konektivitas dua arah 1 TB/s. Dalam konfigurasi empat APU, mereka dapat berkomunikasi dengan kecepatan tinggi dan semuanya memiliki koneksi PCIe Gen5 x16. Skala ini diterapkan pada superkomputer, dan El Capitan, “mainan” terbaru Departemen Energi Amerika Serikat, diperkirakan akan berjalan pada 2 exaFLOPS.

El Capitan dari AMD akan melampaui semua superkomputer teratas dunia saat ini. Frontier, yang juga menggunakan prosesor AMD, masih menjadi yang tercepat dengan puncak 1,2 exaFLOPS. Hanya ada satu komputer lain yang mencapai 1 exaFLOPS, sementara sisanya berada di kisaran 500 teraFLOPS atau lebih rendah. Performa El Capitan yang diharapkan akan membuatnya menjadi yang teratas dengan mudah, sekaligus menjadi superkomputer AMD ketiga yang masuk dalam 10 besar dunia.

Sumber: AMD via Tomshardware

Share This Article
Leave a comment

Leave a Reply

Your email address will not be published. Required fields are marked *