Di dunia kecerdasan buatan, model bahasa telah lama melangkah perlahan—memprediksi satu kata demi satu kata hingga kalimat terbentuk. Tarian kata demi kata ini telah mendukung raksasa seperti GPT-4 dan Claude, mengubah data yang berantakan menjadi teks yang halus dan koheren. Namun, Mercury dari Inception Labs sedang mengguncang keadaan. Alih-alih menebak setiap kata dengan susah payah, Mercury menciptakan seluruh potongan teks sekaligus dengan menggunakan metode yang disebut difusi. Ideanya? Lompatan berani yang mungkin menjadi masa depan penulisan mesin.
ChatGPTDeepSeek

Cara Lama: Melangkah Satu Kata Sekali Waktu

Model tradisional beroperasi seperti seorang penulis hati-hati, memprediksi setiap kata bergiliran. Mereka mulai dengan fragmen, seperti “Kucing itu duduk di…”, dan kemudian menebak kata berikutnya berdasarkan tumpukan data yang besar. Setiap kata adalah kalkulasi kecil yang dibangun di atas kata sebelumnya. Ini adalah metode yang bekerja dengan baik, mengubah kekacauan menjadi puisi atau kode, tetapi bisa menjadi proses yang lambat dan melelahkan. Setiap token tambahan memerlukan putaran komputasi lainnya, dan satu kesalahan dapat membuat seluruh kalimat menyimpang. Untuk tugas yang membutuhkan respons cepat seperti kilat, metode ini kadang tidak bisa mengikuti.
Difusi: Memahat Kalimat dari Kekacauan

Mercury membalikkan skrip lama. Alih-alih bergerak maju perlahan kata demi kata, ia memulai dengan campuran yang berantakan—sebuah kekacauan yang bising dan diacak—dan membentuk semuanya sekaligus menjadi teks yang halus. Pikirkan ini sebagai seorang seniman yang memahat patung dari blok batu kasar: bentuk akhir muncul hampir secara magis, lebih cepat dari yang bisa Anda kedipkan. Berkat proses paralel ini, Mercury dapat menghasilkan lebih dari 1000 token per detik di GPU NVIDIA H100 yang mutakhir—kecepatan yang 5 hingga 10 kali lebih cepat daripada model tradisional. Seperti yang diungkapkan oleh seorang ahli, “Ini seperti beralih dari sepeda ke mobil balap.”
Bagaimana Performa Mercury Dibandingkan yang Terbaik?

Tentu saja, kecepatan Mercury adalah bintang bersinar. Tetapi ketika berbicara tentang kualitas, kompetisi telah menetapkan standar yang tinggi. Model autoregresif seperti GPT-4 dan Claude dikenal karena prosa yang nuans dan penalaran yang tajam, mampu menyisipkan kecerdasan dan emosi halus. Mercury, di sisi lain, bersinar paling terang di area tertentu. Ambil Mercury Coder, misalnya. Ini menghasilkan kode Python atau JavaScript dengan kecepatan kilat, sering kali menyamai—atau bahkan melampaui—para pesaingnya yang lebih hati-hati. Proses difusi juga berarti bahwa kesalahan akan diratakan selama penggenerasian, sehingga Anda mendapatkan lebih sedikit momen “oops, loop itu rusak”.
Namun, setiap mawar memiliki durinya. Dalam tugas yang membutuhkan sentuhan bercerita atau argumen yang dalam dan rumit, teks Mercury dapat terasa sedikit lebih utilitarian—kurang seperti seni dan lebih seperti laporan langsung. Imbalannya jelas: kecepatan yang menyala terkadang berarti sedikit kurangnya kehalusan. Tetapi dengan Mercury yang baru memulai, celah itu mungkin menyusut lebih cepat dari yang Anda harapkan.
Masa Depan Model Difusi
Mercury bukan hanya alat lain di rak—ini adalah tanda dari apa yang mungkin datang selanjutnya. Model difusi telah membuat gelombang dalam generasi gambar dan audio. Namun, kata-kata adalah kacang yang lebih sulit untuk dipecahkan karena mereka penuh dengan makna dan nuansa. Meski begitu, Inception Labs telah berhasil membuat model tingkat komersial yang menulis dengan kecepatan warp. Bayangkan ini: asisten AI yang tidak hanya menjawab dalam sekejap tetapi juga menangkap nada dengan sempurna, pencipta konten yang membuat artikel lengkap dalam beberapa detik, dan seluruh dunia baru efisiensi dalam layanan pelanggan dan pengembangan perangkat lunak.
Namun, tantangan tetap ada. Keluaran cepat Mercury terkadang mengorbankan nuansa kaya yang membuat cerita menjadi bermakna. Dan ketika model semakin besar dan kompleks, pertanyaan tentang penanganan teks epik dengan 100.000 token masih terus ada. Pesaing seperti xAI dan OpenAI tidak diam, mereka sedang mengerjakan pendekatan hibrida yang mungkin menggabungkan kecepatan difusi dengan kedalaman model tradisional.
Sebuah Lompatan yang Layak untuk Diperhatikan
Mercury mungkin belum sempurna, tetapi sudah menciptakan gelombang. Prediksi kata demi kata tradisional telah memberikan hasil yang brilian selama bertahun-tahun, tetapi di dunia cepat saat ini, kecepatan itu penting. Dengan proses difusi inovatifnya, Mercury menunjukkan kepada kita bahwa kadang-kadang, sedikit risiko dapat menghasilkan imbalan besar. Tatanan AI sedang berkembang, dan perjalanan Mercury adalah sesuatu yang perlu diperhatikan. Saat ia belajar dan berkembang, kita mungkin saja menyaksikan awal era baru dalam cara mesin menulis—masa depan di mana kecepatan dan kualitas bukanlah hal yang saling eksklusif, tetapi dua sisi dari koin yang sama.
Jadi, meskipun teks Mercury mungkin sedikit lebih langsung untuk sekarang, potensinya sama menariknya dengan perjalanan rollercoaster—penuh dengan naik turun, dan belokan tak terduga. Hanya waktu yang akan memberitahukan apakah ia dapat merombak aturan penceritaan AI, tetapi satu hal yang pasti: percakapan seputar model bahasa tidak akan pernah sama lagi.