Dalam dunia teknologi kecerdasan buatan (AI), persaingan antar perusahaan semakin ketat. Salah satu pemain besar, Alibaba, baru saja meluncurkan Qwen 2.5-Max. Model ini adalah versi terbaru dari jajaran AI mereka yang menggunakan pendekatan Mixture-of-Experts (MoE). Dengan kemampuan yang mengesankan, LLM yang satu ini berhasil mencuri perhatian para ahli teknologi.
Model ini telah dilatih menggunakan lebih dari 20 triliun token. Proses fine-tuning dilakukan dengan teknik canggih seperti Supervised Fine-Tuning (SFT) dan Reinforcement Learning from Human Feedback (RLHF). Teknik-teknik ini memastikan bahwa Qwen 2.5-Max tidak hanya pintar tetapi juga adaptif terhadap preferensi manusia.
Alibaba membuka akses ke model ini melalui platform Qwen Chat. Pengguna dapat berinteraksi langsung dengan AI untuk menjelajahi kemampuannya. Bagi pengembang, API Qwen 2.5-Max tersedia melalui Alibaba Cloud. Ini memudahkan integrasi ke dalam proyek-proyek yang sudah ada.
Qwen 2.5-Max Unggul di Benchmark
Salah satu alasan utama AI besutan Alibaba ini menarik perhatian adalah performanya yang luar biasa di berbagai benchmark. Model ini diuji pada metrik populer seperti MMLU-Pro untuk pemecahan masalah tingkat perguruan tinggi, LiveCodeBench untuk kemampuan coding, LiveBench untuk kemampuan umum, dan Arena-Hard untuk evaluasi preferensi manusia.
Hasilnya sangat menjanjikan. Menurut Alibaba, AI besutannya berhasil melampaui DeepSeek V3 dalam beberapa benchmark penting. Ini termasuk Arena-Hard, LiveBench, LiveCodeBench, dan GPQA-Diamond. Selain itu, model ini juga menunjukkan hasil kompetitif di MMLU-Pro.
The burst of DeepSeek V3 has attracted attention from the whole AI community to large-scale MoE models. Concurrently, we have been building Qwen2.5-Max, a large MoE LLM pretrained on massive data and post-trained with curated SFT and RLHF recipes. It achieves competitive… pic.twitter.com/oHVl16vfje
— Qwen (@Alibaba_Qwen) January 28, 2025
Tidak hanya bersaing dengan model open-source, Qwen 2.5-Max juga diadu dengan model proprietary seperti GPT-4o dan Claude-3.5-Sonnet. Meskipun akses ke model proprietary terbatas, Qwen 2.5-Max tetap unggul dalam beberapa aspek. Model ini bahkan mampu menyaingi Llama-3.1-405B, salah satu model open-weight terbesar saat ini.
“Model dasar kami menunjukkan keunggulan signifikan di sebagian besar benchmark,” kata Alibaba. Perusahaan yakin bahwa peningkatan teknik post-training akan membawa versi berikutnya ke level yang lebih tinggi lagi.
Alibaba ingin memastikan bahwa Qwen 2.5-Max dapat diakses oleh semua orang. Untuk itu, mereka mengintegrasikan model ini ke dalam platform Qwen Chat. Pengguna dapat menjelajahi berbagai fitur, mulai dari pencarian informasi hingga pemahaman atas pertanyaan kompleks.
Bagi pengembang, API AI ini tersedia dengan nama “qwen-max-2025-01-25” di Alibaba Cloud. Prosesnya cukup sederhana. Pengguna hanya perlu mendaftar akun Alibaba Cloud, mengaktifkan layanan Model Studio, dan menghasilkan API key.
Menariknya, API ini kompatibel dengan ekosistem OpenAI. Hal ini membuat integrasi menjadi lebih mudah bagi pengembang yang sudah menggunakan alat-alat OpenAI. Dengan demikian, pengguna dapat mencoba model ini tanpa harus membangun sistem dari awal.
Peluncuran Qwen 2.5-Max menunjukkan komitmen Alibaba terhadap perkembangan AI. Perusahaan tidak hanya fokus pada peningkatan performa benchmark. Mereka juga ingin meningkatkan kemampuan berpikir dan bernalar model-model ini.
“Peningkatan ukuran data dan model tidak hanya menunjukkan kemajuan dalam kecerdasan model tetapi juga mencerminkan dedikasi kami pada penelitian inovatif,” kata Alibaba.
Ke depannya, tim berencana untuk memperluas penerapan reinforcement learning. Tujuannya adalah untuk mengembangkan kemampuan bernalar yang lebih maju. Jika berhasil, model ini bisa melampaui kecerdasan manusia dalam memecahkan masalah kompleks.
Dampak dari inovasi ini bisa sangat besar. Saat metode scaling terus berkembang, Qwen 2.5-Max dan model serupa berpotensi mengubah berbagai bidang yang didorong oleh AI. Dari otomatisasi industri hingga solusi kesehatan, kemungkinannya hampir tak terbatas.
Sumber: Qwen