DeepSeek Cetak Sejarah Baru: AI dengan Efisiensi 10x Lipat

Dimas Galih Windudjati

DeepSeek yang merupakan perusahaan teknologi asal Tiongkok, berhasil mencuri perhatian dunia dengan pencapaian terbarunya di bidang kecerdasan buatan (AI). Perusahaan ini melatih model bahasa berbasis Mixture-of-Experts (MoE) dengan 671 miliar parameter menggunakan kluster yang terdiri dari 2.048 GPU Nvidia H800. Yang mengejutkan, proses ini hanya memakan waktu sekitar dua bulan dengan efisiensi 10 kali lipat lebih tinggi dibandingkan pemimpin industri AI seperti Meta.

Terobosan ini dicapai berkat serangkaian optimisasi canggih dan penggunaan teknologi PTX (Parallel Thread Execution) dari Nvidia, alih-alih CUDA yang lebih umum digunakan. Menurut analisis Mirae Asset Securities Korea, PTX memungkinkan DeepSeek melakukan penyesuaian pada tingkat thread dan warp, sesuatu yang tidak dapat dilakukan dengan CUDA C/C++.

PTX sendiri adalah set instruksi menengah yang dirancang Nvidia untuk GPU-nya. Teknologi ini berada di antara bahasa pemrograman tingkat tinggi seperti CUDA C/C++ dan kode mesin tingkat rendah (SASS). Dengan PTX, AI asal Tiongkok ini mampu melakukan optimisasi yang sangat detail, termasuk alokasi register dan penyesuaian thread/warp, yang akhirnya meningkatkan kinerja secara signifikan.

Salah satu contoh nyata adalah saat DeepSeek melatih model V3-nya. Perusahaan ini mengonfigurasi ulang GPU Nvidia H800 dengan mengalokasikan 20 dari 132 streaming multiprocessor untuk komunikasi antar-server. Langkah ini dilakukan untuk mengatasi keterbatasan konektivitas prosesor dan mempercepat transaksi data. Selain itu, DeepSeek juga menerapkan algoritma pipeline canggih untuk memaksimalkan performa.

Namun, optimisasi semacam ini tidak mudah dipertahankan. Dibutuhkan keahlian teknis yang luar biasa dari para insinyur DeepSeek untuk mencapai hasil seefisien ini. Terlebih, keterbatasan pasokan GPU global yang diperparah oleh pembatasan ekspor AS telah memaksa perusahaan seperti DeepSeek untuk mencari solusi inovatif.

Terobosan DeepSeek ini tidak hanya berdampak pada kemajuan teknologi, tetapi juga mengguncang pasar. Beberapa investor mulai khawatir bahwa kebutuhan akan perangkat keras berkinerja tinggi untuk model AI baru akan menurun, yang berpotensi merugikan penjualan perusahaan seperti Nvidia. Saham Nvidia bahkan sempat kehilangan nilai pasar sebesar $589 miliar akibat kepanikan ini.

Pat Gelsinger, mantan CEO Intel, memiliki pandangan berbeda. Menurutnya, aplikasi AI seperti yang dikembangkan DeepSeek justru memanfaatkan semua daya komputasi yang tersedia. Ia melihat terobosan ini sebagai peluang untuk menghadirkan AI ke perangkat-perangkat murah di pasar massal.

Sam Altman, bos OpenAI, juga memberikan apresiasi. Pada 2023, Altman menyebut persaingan di industri AI hampir mustahil. Namun, kini ia mengakui bahwa pencapaian DeepSeek sangat mengesankan.

Meski demikian, belum diketahui berapa besar investasi yang dikeluarkan DeepSeek untuk mencapai hasil ini. Yang pasti, langkah ini menegaskan posisi DeepSeek sebagai pemain kunci di industri AI global.

Sumber: TomsHardware

Share This Article
Leave a Comment

Leave a Reply

Your email address will not be published. Required fields are marked *