GPT 4.5 Cuối Cùng Cũng Đến: Nó Có Thật Sự Vượt Trội Hơn Claude 3.7?

Chỉ mới bốn ngày kể từ khi Claude phát hành Claude 3.7 sonnet. Và đây là chúng tôi, chào mừng đến với GPT 4.5, mô hình lớn nhất và tốt nhất của Open AI cho trò chuyện cho đến nay.
Hãy tưởng tượng trò chuyện với một AI mà cảm giác như bạn bè thông thái nhất của bạn — một người không chỉ đưa ra những ý tưởng thông minh mà còn thực sự “hiểu” bạn. Đó là lời hứa đằng sau phiên bản mới nhất của OpenAI, GPT‑4.5. Mới ra lò và đã thu hút nhiều cuộc trò chuyện giữa những người yêu thích công nghệ, GPT‑4.5 đang thiết lập tiêu chuẩn cao hơn cho cuộc đối thoại tự nhiên, giống như con người.

Bạn đã sẵn sàng khám phá những khả năng tiên tiến này và nhiều hơn nữa chưa? Khám phá Anakin AI—trung tâm AI một điểm đến cho hàng trăm mô hình và công cụ. Đăng ký ngay bây giờ và làm tăng cường sự sáng tạo của bạn mà không cần chuyển đổi trang web!

Điều gì đặc biệt về GPT‑4.5?

GPT‑4.5, với mã hiệu Orion, là mô hình lớn nhất và tiêu tốn sức mạnh tính toán nhất của OpenAI cho đến nay. Nó xây dựng trên thành công của GPT‑4o nhưng nâng cấp lên một tầm cao mới bằng cách mở rộng việc học không giám sát. Bằng cách đào tạo trên 12.8 triệu tham số — tăng 60% so với GPT‑4o — và định hướng đầu vào thông qua 128 mạng lưới chuyên gia động, GPT‑4.5 được thiết kế để nhận diện các mẫu và tạo ra những kết nối sáng tạo như chưa từng thấy. Trong các đánh giá ban đầu, nó vượt trội hơn người tiền nhiệm bằng cách giảm sự ảo tưởng xuống gần 25 điểm phần trăm và tăng độ chính xác của câu hỏi khoa học từ 53.6% lên 71.4%. Ngay cả trong toán học, nó tăng từ 9.3% lên 36.7% trên tiêu chí AIME ’24!

Nhưng đừng bị lừa — đây không phải là một mô hình chỉ để xử lý số liệu. Với các lớp định hình cảm xúc tiên tiến, GPT‑4.5 có thể điều chỉnh giọng điệu để phù hợp với cuộc trò chuyện. Dù bạn cần một lời an ủi sau một ngày khó khăn hay một tia sáng tạo cho dự án tiếp theo của mình, GPT‑4.5 nhằm mang đến những phản hồi ấm áp và đáng ngạc nhiên như con người.

Các tiêu chuẩn đánh giá nổi bật

Hãy cùng xem qua một số con số:

Độ chính xác khoa học & sự thật:
GPT‑4.5 đạt 71.4% trên GPQA — một cú nhảy vọt từ 53.6% của GPT‑4o. Cú nhảy này có nghĩa là khả năng “ảo tưởng” khi giải quyết các câu hỏi khoa học hoặc kiến thức chung thấp hơn nhiều, khiến phản hồi của nó đáng tin cậy hơn.
Toán học:
Trong bài kiểm tra toán AIME ’24, GPT‑4.5 đạt 36.7%, một bước tiến lớn so với 9.3% của GPT‑4o. Tuy nhiên, nó vẫn chậm hơn những mô hình chuyên biệt như o3-mini, đạt khoảng 87.3%. Rõ ràng, trong khi GPT‑4.5 ngày càng cải thiện khả năng toán học, trọng tâm của nó chủ yếu là vào cuộc trò chuyện tự nhiên.
Kỹ năng đa ngôn ngữ:
Với 85.1% trên tiêu chí MMMLU, GPT‑4.5 chứng minh rằng nó có thể xử lý nhiều ngôn ngữ tốt — lý tưởng cho việc sử dụng toàn cầu.
Hiệu suất lập trình:
Trong các tác vụ lập trình được đo bằng SWE‑Bench, GPT‑4.5 đạt 38.0% so với 30.7% của GPT‑4o. Mặc dù đây là một cải thiện, nó vẫn chạy sau các mô hình như Claude 3.7 Sonnet trong lĩnh vực này.

Các số liệu này chứng minh rằng trong khi GPT‑4.5 tỏa sáng trong các tác vụ trò chuyện hàng ngày và độ chính xác thông tin, nó không phải là mô hình mạnh nhất khi nói đến lập trình cường độ cao hoặc lý luận toán học phức tạp. Nó là một tay nghề đa năng, xuất sắc trong lĩnh vực “cảm xúc con người” nhưng nhường một chút cho các mô hình lý luận chuyên biệt.

Tổng thể, các tiêu chuẩn này cho thấy GPT‑4.5 là một mô hình xuất sắc trong độ chính xác thông tin và hiểu biết đa ngôn ngữ, trong khi kỹ năng toán học và lập trình của nó, mặc dù đã cải thiện, không phải là điểm mạnh chính. Nó được tối ưu hóa cho cuộc trò chuyện thân thiện, giống con người — hoàn hảo cho các tác vụ sáng tạo và đối thoại hàng ngày.

Để có một trải nghiệm liền mạch khi khám phá những mô hình này và nhiều hơn nữa, hãy kiểm tra Anakin AI — nền tảng AI tất cả trong một cho phép bạn chuyển đổi giữa các công cụ một cách dễ dàng mà không cần nhảy từ trang này sang trang khác.

Giá Của Sự Xuất Sắc

Tất cả sức mạnh trí tuệ này đi kèm với mức giá khá cao. Với mức giá API là 75 USD mỗi triệu mã thông tin đầu vào và 150 USD mỗi triệu mã thông tin đầu ra — và một gói ChatGPT Pro với mức phí 200 USD mỗi tháng — GPT‑4.5 không phải là một món hời. Nhưng như nhiều người dùng sẽ nói với bạn, thường thì bạn nhận được những gì bạn đã trả. Đối với việc viết sáng tạo, hỗ trợ cảm xúc, và trải nghiệm trò chuyện mượt mà, tự nhiên, chi phí thêm có thể đáng để xem xét.

Các trường hợp sử dụng quan trọng

GPT‑4.5 là hoàn hảo cho các nhiệm vụ mà một cuộc trò chuyện thân thiện, chu đáo là điều quan trọng:

Hỗ trợ cảm xúc & Huấn luyện: Nó giống như có một người bạn khôn ngoan luôn lắng nghe và đưa ra lời khuyên nhẹ nhàng.
Cộng tác sáng tạo: Lên ý tưởng cho tiểu thuyết hoặc chiến dịch marketing tiếp theo của bạn? GPT‑4.5 có thể đưa ra những ý tưởng sống động và những phép ẩn dụ rõ ràng.
Tổng hợp tài liệu: Cần tập hợp thông tin từ nhiều nguồn thành một báo cáo gọn gàng? Mô hình này cũng có thể làm được điều đó.
Tự động hóa tác vụ đại lý: Dù là điều phối quy trình đa bước hay tóm tắt dữ liệu, GPT‑4.5 có thể giảm bớt khối lượng công việc.

Một Nền Tảng Liên Kết Tất Cả

Bây giờ, nếu bạn giống như tôi — luôn nhảy qua các trang web để thử nghiệm các mô hình AI khác nhau — hãy để tôi bật mí một bí mật nhỏ: Anakin AI. Nền tảng AI tất cả trong một này là một cuộc cách mạng. Thay vì phải làm việc với nhiều công cụ và trang web, anakin.ai đưa hàng trăm mô hình và công cụ AI — văn bản, hình ảnh, video, âm thanh — đến ngay trong tầm tay của bạn trong một giao diện liền mạch. Nó giống như có bộ công cụ AI cá nhân của bạn, tất cả trong một nơi, cho phép bạn thử nghiệm, tích hợp, và triển khai các mô hình như GPT‑4.5 mà không gặp bất kỳ rắc rối nào. Những người đã thử nghiệm cho biết đây thực sự là một sự tiết kiệm thời gian và như một luồng gió mới trong thế giới công cụ AI hỗn độn.

GPT‑4.5 so với các đối thủ như Claude 3.7 Sonnet như thế nào?

Khi so sánh với các “ông lớn” AI khác:

Claude 3.7 Sonnet: Trong khi Claude 3.7 xuất sắc trong lý luận có cấu trúc và lập trình (với điểm SWE‑Bench cao hơn), GPT‑4.5 dẫn đầu trong việc tạo ra các cuộc trò chuyện thú vị và thông minh về cảm xúc.
Google’s Gemini Ultra 2.0: Gemini Ultra cung cấp khả năng đa phương tiện xuất sắc, nhưng quy mô khổng lồ của GPT‑4.5 mang lại cho nó một cơ sở kiến thức rộng hơn và một luồng đối thoại tự nhiên hơn.
Mô hình lý luận (o1/o3-mini): Những mô hình này vẫn vượt trội hơn GPT‑4.5 trong các nhiệm vụ toán học và lập trình kỹ thuật, cho thấy rằng không có mô hình nào phù hợp với tất cả trong thế giới AI.

Con Đường Phía Trước

OpenAI không ngừng phát triển. Với sự rò rỉ về những mô hình hybrid có thể kết hợp những điều tốt nhất của cả hai thế giới — cá tính trò chuyện của GPT‑4.5 với lý luận có cấu trúc của các anh em o-series của nó — tương lai đang tràn đầy hứa hẹn. Hiện tại, GPT‑4.5 có sẵn như một bản xem trước nghiên cứu cho người dùng ChatGPT Pro và một số khách hàng doanh nghiệp chọn lọc, với quyền truy cập rộng hơn sẽ được triển khai sớm.

Suy Nghĩ Cuối

GPT‑4.5 đánh dấu một bước tiến quan trọng trong việc làm cho AI cảm giác giống như một người cộng tác con người hơn — thấu hiểu, sáng tạo, và sẵn sàng trò chuyện ngay lập tức. Chắc chắn, nó có giá cao và không phải là lựa chọn tốt nhất cho lập trình cường độ cao hoặc toán học sâu, nhưng đối với bất kỳ ai đang tìm kiếm một đối tác kỹ thuật số thân thiện để lên ý tưởng hoặc giúp viết những bản sao marketing hấp dẫn, nó có thể là lựa chọn hoàn hảo.

Và nhớ rằng, nếu bạn đang háo hức khám phá một bộ công cụ toàn diện của các mô hình AI mà không gặp phải đau đầu khi chuyển đổi giữa các trang web, hãy kiểm tra Anakin AI. Đây là nơi tương lai của AI tồn tại — mang đến một loạt công cụ cùng nhau trong một gói gọn gàng giúp bạn tập trung vào những gì quan trọng nhất: đổi mới và sáng tạo.