ในโลกของปัญญาประดิษฐ์ โมเดลภาษาได้ก้าวเข้ามาอย่างช้าๆ—พยากรณ์คำหนึ่งหลังจากนั้นจนกว่าจะเกิดประโยคขึ้น การเต้นรำทีละคำนี้ได้ส่งเสริมยักษ์ใหญ่ต่างๆ เช่น GPT-4 และ Claude เปลี่ยนข้อมูลที่ยุ่งเหยิงให้เป็นข้อความที่ราบรื่นและเข้าใจได้ อย่างไรก็ตาม Mercury ของ Inception Labs กำลังก่อให้เกิดการเปลี่ยนแปลง แทนที่จะเดาคำแต่ละคำอย่างยากลำบาก Mercury สร้างข้อความทั้งหมดในครั้งเดียวด้วยวิธีที่เรียกว่า diffusion แนวคิด? การกระโดดอย่างกล้าหาญที่อาจเป็นอนาคตของการเขียนด้วยเครื่องจักร
ChatGPTDeepSeek

วิธีเก่า: ค่อยๆ เดินหน้าทีละคำ

โมเดลแบบดั้งเดิมทำงานเหมือนผู้เขียนที่ระมัดระวัง ซึ่งพยากรณ์แต่ละคำในลำดับ พวกเขาเริ่มต้นด้วยชิ้นส่วนเช่น “แมวได้นั่งอยู่บน…” และจากนั้นก็เดาคำถัดไปตามข้อมูลจำนวนมาก แต่ละคำเป็นการคำนวณเล็กน้อยที่สร้างขึ้นจากคำก่อนหน้า มันเป็นวิธีการที่ทำงานได้ดี เปลี่ยนความยุ่งเหยิงให้เป็นบทกวีหรือโค้ด แต่ก็เป็นกระบวนการที่ช้าและต้องใช้แรงงาน ทุกโทเค็นเพิ่มเติมต้องการการคำนวณอีกหนึ่งรอบ และความผิดพลาดเดียวอาจทำให้ทั้งประโยคหลุดออกจากเส้นทาง สำหรับงานที่ต้องการการตอบสนองอย่างรวดเร็วมากๆ วิธีนี้บางครั้งก็ไม่สามารถตามทัน
Diffusion: ปั้นประโยคจากความยุ่งเหยิง

Mercury เปลี่ยนการเขียนแบบเก่าให้กลับด้าน แทนที่จะค่อยๆ เดินหน้าทีละคำ มันเริ่มต้นด้วยการผสมที่ยุ่งเหยิง—การยุ่งเหยิงที่เสียงดัง และตีความทั้งหมดในครั้งเดียวให้เป็นข้อความที่เรียบร้อย ลองนึกถึงมันเหมือนกับศิลปินที่สลักประติมากรรมจากก้อนหินที่หยาบ: รูปแบบสุดท้ายปรากฏขึ้นเกือบจะเหมือนมนต์สะกดเร็วกว่าเวลาที่คุณจะกะพริบตา ขอบคุณกระบวนการขนานนี้ Mercury สามารถผลิตโทเค็นได้มากกว่า 1000 โทเค็นต่อวินาทีบน NVIDIA H100 GPU ที่ทันสมัย—ความเร็วที่เร็วกว่า 5 ถึง 10 เท่าของโมเดลแบบดั้งเดิม ตามที่ผู้เชี่ยวชาญคนหนึ่งกล่าว “มันเหมือนกับการเปลี่ยนจากจักรยานไปยังรถแข่ง”.
Mercury เปรียบเทียบกับสิ่งที่ดีที่สุดได้อย่างไร?

แน่นอนว่า ความเร็วของ Mercury เป็นดาวเด่นของมัน แต่เมื่อพูดถึงคุณภาพ ผู้แข่งขันได้ตั้งบาร์สูง โมเดลออโต้เรเกรสซีฟเช่น GPT-4 และ Claude เป็นที่รู้จักในเรื่องความละเอียดอ่อนของการเขียน และเหตุผลที่มีความชัดเจน ซึ่งสามารถแทรกแซงอารมณ์และอารมณ์ได้อย่างละเอียด Mercury โดยเฉพาะจุดเด่นในด้านเฉพาะ ถือว่า Mercury Coder เป็นตัวอย่าง มันผลิตโค้ด Python หรือ JavaScript ได้อย่างรวดเร็ว หลายครั้งที่มีความเร็วที่คู่แข่งที่มีการพัฒนามากกว่ายอดเยี่ยมกว่า กระบวนการ diffusion ยังหมายความว่าข้อผิดพลาดต่างๆ จะถูกปรับเรียบในระหว่างการสร้าง ดังนั้นคุณจะได้มีโอกาสน้อยลงในการพบกับความผิดพลาด “อุ๊ย วงกลมนี้มีปัญหา”
อย่างไรก็ตาม ทุกดอกกุหลาบมีหนาม ในงานที่ต้องการการเล่าเรื่องหรือตรรกะที่ลึกซึ้ง Mercury อาจรู้สึกกระด้างมากขึ้น—น้อยกว่าในรูปแบบของศิลปะและมากขึ้นในรูปแบบรายงานที่ตรงไปตรงมา ข้อแลกเปลี่ยนเป็นที่ชัดเจน: ความเร็วที่รวดเร็วมักหมายถึงการมีความละเอียดน้อยลง แต่เมื่อ Mercury เพิ่งเริ่มต้นขึ้น อาจจะย่อช่องว่างนี้ให้เล็กลงได้เร็วกว่าที่คุณคาดการณ์ไว้
อนาคตของโมเดล Diffusion
Mercury ไม่ใช่แค่เครื่องมืออีกชิ้นหนึ่งบนชั้นวาง—มันเป็นสัญญาณของสิ่งที่จะมาถึง โมเดล diffusion ได้สร้างคลื่นในด้านการสร้างภาพและเสียงแล้ว คำต่าง ๆ เป็นเรื่องที่ซับซ้อนมากขึ้นเพราะมันบรรจุไปด้วยความหมายและความละเอียดอ่อน แม้ว่า Inception Labs จะประสบความสำเร็จในการสร้างโมเดลที่มีคุณภาพการค้า ที่สามารถเขียนได้อย่างรวดเร็ว ตามภาพนี้ AI ผู้ช่วยที่ไม่เพียงแต่ตอบรับในพริบตา แต่ยังสามารถจับโทนเสียงได้อย่างสมบูรณ์ ผู้สร้างเนื้อหาที่สามารถเขียนบทความเต็มภายในไม่กี่วินาที และอีกหนึ่งขอบเขตใหม่ซึ่งจะช่วยสร้างประสิทธิภาพในบริการลูกค้าและการพัฒนาโปรแกรมซอฟต์แวร์
กล่าวได้ว่า ความท้าทายยังคงอยู่ ความเร็วของ Mercury บางครั้งทำให้สูญเสียความละเอียดอ่อนที่ทำให้เรื่องราวมีความดึงดูดใจ และในขณะที่โมเดลมีขนาดใหญ่ขึ้นและซับซ้อนขึ้น คำถามเกี่ยวกับการจัดการข้อความขนาดใหญ่ 100,000 โทเค็นก็ยังคงอยู่ คู่แข่งเช่น xAI และ OpenAI กำลังพัฒนาแนวทางแบบไฮบริดที่อาจนำความเร็วของ diffusion ผสมกับความลึกของโมเดลแบบดั้งเดิม
การกระโดดที่ควรจับตามอง
Mercury อาจยังไม่สมบูรณ์แบบ แต่ในตอนนี้มันกำลังสร้างคลื่น การพยากรณ์คำแบบเดิมได้ส่งมอบผลลัพธ์ที่ยอดเยี่ยมมาหลายปี แต่ในโลกที่มีความรวดเร็วในปัจจุบัน ความเร็วเป็นสิ่งสำคัญ ด้วยกระบวนการ diffusion ที่สร้างสรรค์ของมัน Mercury แสดงให้เราเห็นว่าบางครั้งความเสี่ยงเล็กน้อยสามารถนำไปสู่วิสัยทัศน์ที่ยิ่งใหญ่ ทิวทัศน์ AI กำลังพัฒนา และการเดินทางของ Mercury ก็เป็นการเดินทางที่ควรติดตาม เมื่อมันเรียนรู้และพัฒนา เราอาจได้เห็นการเริ่มต้นของยุคใหม่ในการเขียนของเครื่องจักร—อนาคตที่ความเร็วและคุณภาพไม่ขัดแย้งกัน แต่เป็นสองด้านของเหรียญเดียวกัน
ดังนั้น แม้ว่าเนื้อหาของ Mercury อาจจะดูตรงไปตรงมามากขึ้นในตอนนี้ แต่ศักยภาพของมันก็ยังน่าตื่นเต้นเหมือนการนั่งรถไฟเหาะ—เต็มไปด้วยการขึ้นและลงและการหักเลี้ยวที่ไม่คาดคิด เท่านั้นเวลาจะบอกได้ว่ามันสามารถเขียนใหม่กฎของการเล่าเรื่องด้วย AI ได้หรือไม่ แต่สิ่งหนึ่งที่แน่นอนคือการสนทนาเกี่ยวกับโมเดลภาษาไม่มีวันเหมือนเดิมอีกต่อไป