GPT 4.5 Akhirnya Hadir: Apakah Ini Benar-Benar Mengungguli Claude 3.7?

Baru saja empat hari sejak Claude meluncurkan sonnet Claude 3.7. Dan di sini kita berada, selamat datang di model percakapan terbesar dan terbaik dari Open AI, GPT 4.5 yang telah ada.
Bayangkan mengobrol dengan AI yang terasa seperti teman paling bijak Anda — yang tidak hanya memberikan ide-ide cerdas tetapi juga benar-benar “memahami” Anda. Itulah janji di balik rilis terbaru OpenAI, GPT‑4.5. Segera setelah dirilis dan sudah memicu percakapan di antara para penggemar teknologi, GPT‑4.5 menetapkan standar lebih tinggi untuk dialog yang alami dan mirip manusia.

Siap menjelajahi kemampuan canggih ini dan lebih banyak lagi? Terjunlah ke Anakin AI—pusat AI satu atap Anda untuk ratusan model dan alat. Daftar sekarang dan tingkatkan kreativitas Anda tanpa perlu berpindah situs!

Apa yang Menarik tentang GPT‑4.5?

GPT‑4.5, dengan kode nama Orion, adalah model terbesar OpenAI yang sangat membutuhkan komputasi hingga saat ini. Model ini membangun kesuksesan GPT‑4o tetapi meningkatkan banyak hal dengan mendalami pembelajaran tidak terawasi ke tingkat yang baru. Dengan dilatih pada 12,8 triliun parameter — peningkatan 60% dibandingkan GPT‑4o — dan mengarahkan masukan melalui 128 jaringan ahli yang dinamis, GPT‑4.5 dirancang untuk mengenali pola dan menarik koneksi kreatif seperti tidak pernah sebelumnya. Dalam evaluasi awal, ia mengungguli pendahulunya dengan mengurangi halusinasi hampir 25 poin persentase dan meningkatkan akurasi pertanyaan ilmiah dari 53,6% menjadi 71,4%. Bahkan dalam matematika, ia melompat dari 9,3% yang minim menjadi 36,7% pada tolok ukur AIME ’24!

Tetapi jangan terpedaya — ini bukan model yang dibangun hanya untuk menghitung angka. Dengan lapisan penyesuaian emosional yang canggih, GPT‑4.5 dapat menyesuaikan nadanya untuk sesuai dengan percakapan. Apakah Anda memerlukan kata-kata penghibur setelah hari yang sulit atau secercah inspirasi kreatif untuk proyek berikutnya, GPT‑4.5 bertujuan untuk memberikan respons yang terasa hangat dan mengejutkan manusiawi.

Tolok Ukur yang Berbicara Banyak

Ayo kita lihat beberapa angka:

Akurasi Sains & Fakta:
GPT‑4.5 mendapatkan nilai 71,4% pada GPQA — loncatan yang signifikan dari 53,6% pada GPT‑4o. Lonjakan ini berarti jauh lebih kecil kemungkinannya untuk “halusinasi” saat menangani pertanyaan sains atau pengetahuan umum, menjadikannya lebih dapat diandalkan.
Matematika:
Dalam tes matematika AIME ‘24, GPT‑4.5 mendapatkan 36,7%, peningkatan besar dibandingkan 9,3% dari GPT‑4o. Meskipun demikian, masih tertinggal di belakang model khusus seperti o3-mini, yang mencetak sekitar 87,3%. Jelas bahwa meskipun GPT‑4.5 semakin baik dalam matematika, fokusnya lebih pada percakapan alami.
Keterampilan Multibahasa:
Dengan skor 85,1% pada tolok ukur MMMLU, GPT‑4.5 membuktikan bahwa ia dapat menangani beberapa bahasa dengan baik — ideal untuk penggunaan global.
Kinerja Pengkodean:
Dalam tugas pengkodean yang diukur oleh SWE‑Bench, GPT‑4.5 mendapatkan 38,0% dibandingkan dengan 30,7% dari GPT‑4o. Meskipun ada peningkatan, masih tertinggal di belakang model seperti Claude 3.7 Sonnet di bidang ini.

Statistik ini membuktikan bahwa sementara GPT‑4.5 bersinar dalam tugas percakapan sehari-hari dan akurasi fakta, ia bukan yang terbaik dalam pemrograman berat atau penalaran matematis yang kompleks. Ia adalah jagoan yang serba bisa, unggul dalam “sentuhan manusia” tetapi memberikan sedikit ruang bagi model penalaran khusus.

Secara keseluruhan, tolok ukur ini menunjukkan GPT‑4.5 sebagai model yang unggul dalam akurasi fakta dan pemahaman multibahasa, sementara keterampilan matematika dan pengkodeannya, meskipun meningkat, bukanlah nilai jual utamanya. Ini dioptimalkan untuk percakapan yang ramah dan mirip manusia — sempurna untuk tugas kreatif dan dialog sehari-hari.

Untuk pengalaman yang mulus menjelajahi model-model ini dan lebih banyak lagi, kunjungi Anakin AI — platform AI semua dalam satu yang memungkinkan Anda berpindah antara alat dengan mudah tanpa harus meloncat dari situs ke situs.

Harga Kej brilliance

Semua daya pikir ini datang dengan biaya premium. Dengan tarif API sebesar $75 per juta token input dan $150 per juta token output — dan langganan ChatGPT Pro seharga $200 per bulan — GPT‑4.5 bukanlah tawaran yang murah. Namun, seperti yang akan dikatakan banyak pengguna, Anda sering mendapatkan apa yang Anda bayar. Untuk penulisan kreatif, dukungan emosional, dan pengalaman mengobrol yang lancar dan alami, biaya tambahan mungkin saja sepadan.

Kasus Penggunaan yang Berarti

GPT‑4.5 sempurna untuk tugas-tugas di mana percakapan yang ramah dan penuh perhatian penting:

Dukungan Emosional & Pelatihan: Ini seperti memiliki teman bijaksana yang mendengarkan dan memberikan nasihat lembut.
Kolaborasi Kreatif: Sedang brainstorming untuk novel atau kampanye pemasaran Anda yang berikutnya? GPT‑4.5 dapat memberikan ide yang hidup dan analogi yang tajam.
Sintesis Dokumen: Perlu mengumpulkan informasi dari berbagai sumber menjadi satu laporan yang rapi? Model ini juga dapat melakukannya.
Automasi Tugas Agenik: Baik itu mengoordinasikan alur kerja multi-langkah atau meringkas data, GPT‑4.5 dapat meringankan beban kerja.

Platform yang Menggabungkan Segalanya

Sekarang, jika Anda seperti saya — selalu berpindah antara situs web untuk menguji berbagai model AI — mari saya berikan sedikit rahasia: Anakin AI. Platform AI semua dalam satu ini adalah pengubah permainan. Alih-alih jongkok antara berbagai alat dan situs web, anakin.ai menyediakan ratusan model dan alat AI — teks, gambar, video, audio — langsung di ujung jari Anda dalam satu antarmuka yang mulus. Ini seperti memiliki kotak alat AI pribadi Anda sendiri, semua dalam satu tempat, sehingga Anda dapat bereksperimen, mengintegrasikan, dan menerapkan model seperti GPT‑4.5 tanpa kesulitan. Mereka yang telah mencobanya mengatakan ini sangat menghemat waktu dan menyegarkan di dunia alat AI yang kacau.

Bagaimana GPT‑4.5 dibandingkan dengan Kompetisi Seperti Claude 3.7 Sonnet?

Ketika dibandingkan dengan raksasa AI lainnya:

Claude 3.7 Sonnet: Sementara Claude 3.7 unggul dalam penalaran terstruktur dan pengkodean (dengan skor SWE‑Bench yang lebih tinggi), GPT‑4.5 memimpin dalam menciptakan percakapan yang menarik dan emosional cerdas.
Gemini Ultra 2.0 dari Google: Gemini Ultra menawarkan kemampuan multimodal yang mengesankan, tetapi skala besar GPT‑4.5 memberikannya basis pengetahuan yang lebih luas dan alur percakapan yang lebih alami.
Model Penalaran (o1/o3-mini): Model-model ini masih mengungguli GPT‑4.5 dalam tugas matematika teknis dan pengkodean, menunjukkan bahwa tidak ada satu ukuran yang cocok untuk semua di dunia AI.

Jalan di Depan

OpenAI tidak beristirahat di atas prestasinya. Dengan desas-desus tentang model hibrida yang mungkin menggabungkan yang terbaik dari kedua dunia — pesona percakapan GPT‑4.5 dengan penalaran terstruktur dari saudara-saudara seri o-nya — masa depan terlihat menjanjikan. Untuk saat ini, GPT‑4.5 tersedia sebagai pratayang penelitian untuk pengguna ChatGPT Pro dan pelanggan perusahaan terpilih, dengan akses lebih luas yang akan segera diluncurkan.

Pemikiran Akhir

GPT‑4.5 menandai langkah penting dalam menjadikan AI terasa lebih seperti kolaborator manusia — empatik, kreatif, dan siap untuk mengobrol kapan saja. Tentu, ini mahal dan bukan yang terbaik untuk pengkodean berat atau matematika yang dalam, tetapi bagi siapa pun yang mencari pasangan digital yang ramah untuk brainstorming atau membantu menulis salinan pemasaran yang hebat, ini mungkin saja cocok.

Dan ingat, jika Anda ingin menjelajahi seluruh rangkaian model AI tanpa sakit kepala berpindah antara situs, kunjungi Anakin AI. Di sinilah masa depan AI berada — menggabungkan berbagai alat dalam satu paket rapi sehingga Anda dapat fokus pada apa yang paling penting: berinovasi dan menciptakan.