Veo 2 ของ Google ตอนนี้อยู่ใน Gemini Advanced: ทำให้การสร้างวิดีโอไปอีกขั้น

Google ได้แนะนำความก้าวหน้าที่โดดเด่นในด้านความคิดสร้างสรรค์ที่ข driven ด้วย AI ด้วยการรวมกลุ่ม Veo 2 เข้ากับ Gemini Advanced อย่างเต็มที่ ทำให้ผู้ใช้สามารถสร้างวิดีโอที่สวยงาม ความยาวแปดวินาทีจากคำบอกเล่าได้โดยตรง เปิดตัวทั่วโลกในวันที่ 15 เมษายน 2025 โมเดลการสร้างวิดีโอที่ทันสมัยนี้ผลิตคลิปความละเอียด 720p ที่เลียนแบบฟิสิกส์ของโลกจริง การเคลื่อนไหวของมนุษย์ และสไตล์การมองที่หลากหลายด้วยความสมจริงที่ไม่เคยมีมาก่อน สามารถเข้าถึงได้ผ่านการสมัครสมาชิก Gemini Advanced, Google AI Studio และ Gemini API Veo 2 เป็นการเปลี่ยนแปลงครั้งใหญ่ในวิธีที่ผู้สร้าง นักการตลาด และนักพัฒนาคิดและผลิตเนื้อหาวิดีโอ — ทำให้การเล่าเรื่องภาพที่มีคุณภาพสูงสามารถเข้าถึงได้ในขณะที่ยกระดับมาตรฐานสำหรับนวัตกรรม AI

ถ้าคุณตื่นเต้นกับ Veo 2 ของ Google แล้ว คุณจะต้องหลงรักการสำรวจตัวสร้างวิดีโอ AI ที่ทรงพลังอื่น ๆ เช่น Runway Gen-3 Alpha Turbo, Minimax Video, และ Tencent Hunyuan — ซึ่งทั้งหมดสามารถใช้งานได้ใน Video Generator ของ Anakin AI ปลดปล่อยความคิดสร้างสรรค์ของคุณวันนี้!

Veo 2: นิยามใหม่ของการสร้างวิดีโอด้วย AI

ที่แกนกลาง Veo 2 เป็นการก้าวกระโดดครั้งใหญ่ในเทคโนโลยี AI เชิงสร้างสรรค์ สร้างจากการวิจัยที่ทันสมัยของ Google DeepMind โมเดลนี้แปลข้อความที่ซับซ้อนเพื่อสร้างวิดีโอที่จับรายละเอียดที่ละเอียดอ่อน เช่น แสง มุมกล้อง และการเคลื่อนไหวที่มีพลศาสตร์ แตกต่างจากเครื่องมือวิดีโอ AI ก่อนหน้านี้ Veo 2 โดดเด่นในการสร้างท่าทางของมนุษย์ที่สมจริง การโต้ตอบของวัตถุอย่างราบรื่น และฉากที่ซับซ้อนที่มีองค์ประกอบที่แตกต่างกันถึง 20 อย่าง — ความสำเร็จที่ก่อนหน้านี้ต้องใช้การอนิเมชั่นด้วยมือหรือทรัพยากรการผลิตที่มีค่าใช้จ่ายสูง

วิธีการทำงาน

ผู้ใช้เพียงแค่เลือก "Veo 2" จากเมนูแบบเลื่อนของโมเดลใน Gemini Advanced ใส่คำบรรยายที่มีรายละเอียด (เช่น, “การแพนภาพกว้างของลูกแมวสีต่างๆ ที่นอนอยู่ในแสงแดด”) และรับวิดีโอ MP4 ภายในไม่กี่นาที โมเดลวิเคราะห์ข้อความเพื่อสัญญาณเชิงพื้นที่ เชิงเวลา และเชิงสไตล์ สร้างแต่ละเฟรมด้วยความใส่ใจในความต่อเนื่องและความแม่นยำทางกายภาพ สำหรับนักพัฒนา การประสานงานผ่าน Gemini API ทำให้สามารถสร้างวิดีโอแบบอัตโนมัติสำหรับแอพ เช่น การสร้างโฆษณาอัตโนมัติหรือเครื่องมือการเล่าเรื่องแบบอินเทอร์แอคทีฟ

คุณภาพภาพยนตร์พบการควบคุมเชิงสร้างสรรค์

การนำเสนอของ Veo 2 สามารถแข่งขันกับการผลิตวิดีโอระดับมืออาชีพในสามด้านสำคัญ:

1. ฟิสิกส์และการเคลื่อนไหวที่เหมือนจริงมาก

โมเดลเลียนแบบแรงโน้มถ่วง แรงเฉื่อย และพันธุศาสตร์ด้วยความแม่นยำที่น่าตกใจ คำบรรยายเช่น “นักเต้นที่ทำการกลับตัวในชายหาดที่มีแสงจันทร์” ไม่เพียงแต่ผลิตการกระทำเท่านั้น แต่ยังรวมถึงการเคลื่อนที่ของทราย การเคลื่อนที่ของผม และพลศาสตร์ของเงาที่สมจริง สิ่งนี้ขจัดผลกระทบ “หุบเขาที่น่าอัศจรรย์” ที่เป็นปัญหาสำหรับระบบวิดีโอ AI ก่อนหน้านี้ ซึ่งการเคลื่อนไหวที่ไม่ธรรมชาติรบกวนการเข้าถึง

2. การปรับแต่งกล้องและสไตล์ขั้นสูง

ผู้ใช้สามารถระบุเทคนิคการสร้างภาพยนตร์ได้ เช่น:

การจัดกรอบภาพ (ซูมใกล้, มุมกว้าง)
การเคลื่อนไหวของกล้อง (การซูมดอลลี, การติดตามภาพ)
สไตล์การมอง (การอนิเมชั่นสีน้ำ, สุนทรียศาสตร์ที่ไซเบอร์พังค์)
ตัวอย่างเช่น การขอ “การถ่ายเวลาผ่านไปของดอกกุหลาบที่บาน ที่ถ่ายด้วยเลนส์ 35 มม. แบบดั้งเดิม” จะผลิตฟุตเทจกึ่งมืดที่มีพื้นผิวคล้ายเม็ดที่เลียนแบบฟิล์มแบบอนาล็อก

3. ความสอดคล้องในฉากที่ซับซ้อน

Veo 2 คงไว้ซึ่งอัตลักษณ์ของตัวละครที่สอดคล้องกันและรายละเอียดของสิ่งแวดล้อมตลอดช่วงเวลาสูงสุดแปดวินาที ทำให้การเล่าเรื่องหลายการกระทำ เช่น “พ่อครัวหั่นผัก คนถึงหม้อที่กำลังเคี่ยว และวางจานในขณะที่แมวมองอยู่บนขอบหน้าต่าง” — มีรูปแบบครัวที่สอดคล้องกัน แสง และท่าทางของแมวในแต่ละเฟรม

การรวมขั้นตอนการทำงานที่ไร้รอยต่อข้ามแพลตฟอร์ม

Google ได้ฝัง Veo 2 เข้าไปในหลายกระบวนการทำงานเพื่อตอบสนองผู้ใช้ที่หลากหลาย:

สำหรับผู้สร้างทั่วไป: Gemini Advanced

ผู้ที่สมัครสมาชิก Google One AI Premium ที่มีค่าใช้จ่าย $20/เดือน สามารถเข้าถึง Veo 2 ได้โดยตรงในส่วนติดต่อ Messenger ของ Gemini แอพมือถือมีเมนูแชร์ที่ออกแบบมาให้ตรงไปตรงมาสำหรับการอัปโหลดแบบทันทีไปยัง TikTok หรือ YouTube Shorts ในขณะที่เวอร์ชันเว็บให้การดาวน์โหลดแบบกลุ่มเพื่อแก้ไขในซอฟต์แวร์ของบุคคลที่สาม

สำหรับนักพัฒนา: Gemini API และ Google AI Studio

Gemini API ให้การเข้าถึงที่โปรแกรมสำหรับ Veo 2 พร้อมด้วยพารามิเตอร์ที่ปรับแต่งได้สำหรับอัตราส่วนภาพ ความเข้มของการเคลื่อนไหว และฟิลเตอร์เชิงสไตล์ โค้ด Python ดังนี้:

from google import genai
client = genai.Client()
operation = client.models.generate_videos(
model="veo-2.0-generate-001",
prompt="นักบินอวกาศที่เล่นกระดานโต้คลื่นผ่านดาวหาง",
config=types.GenerateVideosConfig(aspect_ratio="16:9")
)

…ทำให้การสร้างวิดีโออัตโนมัติสำหรับแอพที่มุ่งเป้าไปที่อุตสาหกรรมอย่างการค้าออนไลน์หรือการศึกษา Google AI Studio ให้พื้นที่ทดลองแบบไม่มีรหัสสำหรับการทดลองคำบรรยายและการส่งออกทรัพย์สินต่าง ๆ

สำหรับนักทดลอง: Whisk Animate

ผู้ที่สมัครสมาชิก Google One AI Premium ได้รับสิทธิ์เข้าถึง Whisk Animate ซึ่งเป็นฟีเจอร์ใน Labs ที่เปลี่ยนภาพนิ่งให้เป็นวิดีโอ อัปโหลดภาพของตัวละครที่ถูกสเก็ตช์ เพิ่มคำบรรยายเช่น “ทำให้ตัวละครโบกมือและยิ้ม” และ Veo 2 จะสร้างการเคลื่อนไหวของตัวละครในขณะที่รักษาสไตล์ศิลปะไว้

นวัตกรรมทางจริยธรรมและมาตรการความปลอดภัย

Google ได้ดำเนินการติดตั้งมาตรการป้องกันที่มีประสิทธิภาพเพื่อจัดการกับความท้าทายทางจริยธรรมของวิดีโอ AI:

Watermarks SynthID: เครื่องหมายการเข้ารหัสที่มองไม่เห็นที่ฝังอยู่ในทุกเฟรมเพื่อตรวจสอบเนื้อหาที่สร้างด้วย AI ช่วยต่อสู้กับข้อมูลที่ไม่ถูกต้อง
นโยบายเนื้อหา: Veo 2 ไม่ยอมรับคำบรรยายที่เกี่ยวข้องกับความรุนแรง ความเปลือย หรือเนื้อหาที่มีลิขสิทธิ์ โดยมีระบบติดตามและตรวจสอบอัตโนมัติและมนุษย์ที่บังคับใช้แนวทาง
ขีดจำกัดการใช้งาน: Gemini Advanced จำกัดการสร้างวิดีโอรายเดือนเพื่อป้องกันการใช้ทรัพยากรโดยไม่มีทางการที่ Google ไม่ได้เปิดเผยจำนวนที่แน่นอน

ปลดปล่อยศักยภาพสร้างสรรค์

เนื้อหาสื่อสังคม: นักโน้มน้าวสร้างมีมและคลิปแบรนด์ที่เป็นที่นิยมโดยไม่ต้องใช้อุปกรณ์ถ่ายทำ
การสร้างต้นแบบ: ผู้สร้างภาพยนตร์สร้างภาพตัดต่อโดยการบรรยายให้กับ Gemini ช่วยประหยัดเวลาหลายสัปดาห์ในกระบวนการก่อนการผลิต
การศึกษา: ครูสร้างอนิเมชั่นที่กำหนดเองเพื่ออธิบายแนวคิดทางวิทยาศาสตร์ เช่น การสังเคราะห์ด้วยแสงหรือกลศาสตร์วงโคจร
การตลาดที่เป็นส่วนตัว: ธุรกิจสร้างวิดีโอนำเสนอผลิตภัณฑ์โดยอัตโนมัติตามความชอบของลูกค้ารายบุคคล

เส้นทางข้างหน้า: อะไรต่อไปสำหรับ Veo 2?

ในขณะที่ Veo 2 ตั้งมาตรฐานใหม่ในอุตสาหกรรม ยังมีข้อจำกัด — ระยะเวลาแปดวินาทีและความละเอียด 720p จำกัดการดำเนินโครงการที่นานหรือความละเอียด Ultra-HD นอกจากนี้ คำบรรยายที่ซับซ้อนบางครั้งให้ผลลัพธ์ที่มีความไม่สมบูรณ์เล็กน้อย อย่างไรก็ตาม แผนที่ของ Google สัญญาว่าจะมีการอัปเกรดในอนาคตที่น่าตื่นเต้น รวมถึงระยะเวลาวิดีโอที่ยาวขึ้น ความละเอียด 4K และเสียงที่ซิงค์กัน

ขณะที่ Veo 2 ถูกเปิดตัวทั่วโลก มันทำให้การผลิตวิดีโอระดับสูงสามารถเข้าถึงได้ โดยมอบอำนาจให้กับผู้สร้างที่ไม่มีความเชี่ยวชาญทางเทคนิคหรืองบประมาณขนาดใหญ่ ในยุคที่การเล่าเรื่องภาพครอบงำ นวัตกรรม AI ใหม่ล่าสุดของ Google ไม่ใช่แค่เครื่องมืออีกชิ้น แต่เป็นตัวเร่งที่ช่วยให้เราจินตนาการถึงวิธีการที่เรานำเสนอแนวคิดต่าง ๆ ไปสู่ชีวิต

พร้อมที่จะยกระดับโครงการสร้างสรรค์ของคุณอย่างไม่ยุ่งยากหรือไม่? ปลดล็อกภาพที่มีคุณภาพระดับถัดไปและวิดีโอภาพยนตร์โดยใช้โมเดลที่ทรงพลัง เช่น Runway Gen-3 Alpha Turbo, Minimax Video, Tencent Hunyuan และ Pyramid Flow — ทั้งหมดในแพลตฟอร์มที่มีประสิทธิภาพเดียว ขุดค้นไปในคุณภาพที่ไม่มีใครเทียบและจินตนาการที่ไม่รู้จบวันนี้: สำรวจ Anakin AI Video Generator