Grok 4 và Grok 4 Heavy của xAI do Elon Musk phát triển vừa cho thấy hiệu suất vượt trội, vượt qua cả OpenAI, Google và Anthropic…..

Công ty AI của Elon Musk, xAI, đã ra mắt các mô hình AI tiên tiến Grok 4 với các chỉ số hiệu suất phá kỷ lục. Có hai mô hình AI mới — Grok 4 và Grok 4 Heavy — và cả hai đều là các mô hình AI tư duy lý luận. Cùng với các mô hình mới, xAI cũng công bố gói đăng ký mới có tên SuperGrok Heavy, với mức giá 300 USD mỗi tháng, cho phép truy cập vào mô hình Grok 4 Heavy.
Về hiệu suất đánh giá, Grok 4 vượt trội hơn tất cả các mô hình AI hàng đầu đến từ OpenAI, Google và Anthropic. Trong bài kiểm tra GPQA, Grok 4 đạt 87,5%, còn Grok 4 Heavy đạt 88,9%. Trong bài kiểm tra AIME 2025, Grok 4 Heavy đạt độ chính xác tuyệt đối 100%.

Đặc biệt, trong bài đánh giá khó Humanity’s Last Exam, Grok 4 Heavy đạt 44,4% và Grok 4 đạt 38,6%, với sự hỗ trợ của công cụ. Trong khi đó, Gemini 2.5 Pro đạt 26,9% và o3 của OpenAI chỉ đạt 24,9% (cũng có hỗ trợ công cụ). Điều này cho thấy Grok 4 hiện đang là mô hình AI tư duy tiên tiến nhất hiện nay.
Đáng chú ý nhất, trong bài đánh giá mới ra mắt ARC-AGI-2, Grok 4 đạt 15,9%, là mức cao nhất tính đến nay. Con số này gấp đôi kết quả của Claude Opus 4 và OpenAI o3. Điều này khiến Grok 4 trở thành mô hình AI tiên phong, vượt trội trong số tất cả các mô hình AI từng được bất kỳ phòng thí nghiệm AI nào phát hành. Còn trong bài kiểm tra cũ hơn ARC-AGI-1, Grok 4 đạt 66,7%, cũng cao hơn cả OpenAI o3-pro và o4-mini được công bố rộng rãi.

xAI cho biết Grok 4 Heavy là mô hình AI lớn nhất của công ty, và có khả năng hoạt động với nhiều tác nhân cùng lúc để giải quyết vấn đề theo hướng song song. Elon Musk cũng cho biết một mô hình AI chuyên viết mã sẽ được phát hành vào tháng 8, một tác nhân đa phương thức (multi-modal agent) sẽ được giới thiệu vào tháng 9, và có thể chúng ta sẽ thấy một mô hình tạo video vào tháng 10.
Tổng thể, xAI một lần nữa chứng minh rằng họ là một trong những phòng thí nghiệm AI hàng đầu, đang huấn luyện các mô hình nền tảng tiên tiến và sẵn sàng thách thức tất cả các “ông lớn” trong ngành AI trên toàn thế giới.