GPT-4o Mini: Model Terbaru OpenAI, Lebih Terjangkau & Efisien

OpenAI baru saja mengumumkan peluncuran GPT-4o Mini, model AI terbaru yang lebih terjangkau dan efisien. Model ini diharapkan dapat memperluas jangkauan aplikasi AI dengan biaya yang lebih rendah.

GPT-4o Mini mencetak 82% pada MMLU (Massive Multitask Language Understanding) dan mengungguli GPT-4 dalam preferensi chat di leaderboard LMSYS. Dengan harga 15 sen per 1 juta token input dan 60 sen per 1 juta token output, model ini jauh lebih murah dibandingkan model sebelumnya dan lebih dari 60% lebih murah dari GPT-3.5 Turbo.

GPT-4o Mini memungkinkan berbagai tugas dengan biaya dan latensi rendah. Model ini cocok untuk aplikasi yang memerlukan banyak panggilan model atau konteks besar, seperti chatbot layanan pelanggan. Saat ini, GPT-4o Mini mendukung teks dan visi dalam API, dengan dukungan untuk teks, gambar, video, dan audio yang akan datang. Model ini memiliki jendela konteks 128K token dan mendukung hingga 16K token output per permintaan.

Model terbaru ini mengungguli GPT-3.5 Turbo dan model kecil lainnya dalam benchmark akademik. Model ini menunjukkan kinerja kuat dalam tugas pemanggilan fungsi, yang memungkinkan pengembang membangun aplikasi yang mengambil data atau melakukan tindakan dengan sistem eksternal. Kinerja yang ditunjukkan juga lebih baik dalam konteks panjang dibandingkan GPT-3.5 Turbo.

Dalam tugas penalaran, GPT-4o Mini mencetak 82.0% pada MMLU. Dalam tugas matematika dan pemrograman, model ini mencetak 87.0% pada MGSM dan 87.2% pada HumanEval. Dalam penalaran multimodal, hasil benchmark yang didapat adalah 59.4% pada MMMU. Model ini telah dievaluasi oleh beberapa mitra terpercaya, termasuk Ramp dan Superhuman, yang menemukan bahwa model terbaru ini lebih baik dari GPT-3.5 Turbo dalam tugas seperti ekstraksi data terstruktur dari file tanda terima.

Keamanan adalah prioritas utama dalam pengembangan model ini. OpenAI menyaring informasi yang tidak diinginkan selama pra-pelatihan dan menggunakan teknik seperti reinforcement learning dengan umpan balik manusia untuk meningkatkan akurasi dan keandalan respons model. Mini memiliki mitigasi keamanan yang sama dengan GPT-4o, yang dinilai menggunakan kerangka kerja kesiapan OpenAI.

GPT-4o Mini adalah model pertama yang menerapkan metode hierarki instruksi, yang membantu model menolak jailbreak, injeksi prompt, dan ekstraksi prompt sistem. Ini membuat respons model lebih andal dan aman digunakan dalam aplikasi skala besar. OpenAI akan terus memantau penggunaan model terbarunya ini dan meningkatkan keamanan model saat risiko baru teridentifikasi.

Model terbaru OpenAI tersebut kini tersedia sebagai model teks dan visi dalam API Asisten, API Chat Completions, dan API Batch. Pengembang membayar 15 sen per 1 juta token input dan 60 sen per 1 juta token output. Pengguna ChatGPT Free, Plus, dan Team dapat mengakses GPT-4o Mini mulai hari ini, menggantikan GPT-3.5. Pengguna Enterprise juga akan memiliki akses mulai minggu depan.

Dalam beberapa tahun terakhir, biaya per token GPT-4o telah turun 99% sejak text-davinci-003. OpenAI berkomitmen untuk terus menurunkan biaya sambil meningkatkan kemampuan model.

Model yang satu ini membuka jalan bagi pengembang untuk membangun dan mengembangkan aplikasi AI yang kuat dengan lebih efisien dan terjangkau. Masa depan AI semakin mudah diakses, andal, dan terintegrasi dalam pengalaman digital harian kita. OpenAI bersemangat untuk terus memimpin jalan ini.

Sumber: OpenAI