
Danh sách các mô hình trí tuệ nhân tạo của hàng hiệu đã bỏ lỡ thời gian ra mắt đã hứa tiếp tục tăng lên.
Mùa hè vừa qua, tỉ phú Elon Musk, người sáng lập và CEO của công ty AI xAI, cho biết rằng Grok 3, mô hình AI chính của xAI, sẽ đến vào "cuối năm" 2024. Grok, câu trả lời của xAI cho các mô hình như GPT-4o của OpenAI và Gemini của Google, có thể phân tích hình ảnh và trả lời câu hỏi, và cung cấp nhiều tính năng trên X, mạng xã hội của Musk.
“Grok 3 cuối năm sau khi đào tạo trên 100k H100s sẽ là một điều đặc biệt thực sự,” Musk viết trong một bài đăng vào tháng 7 trên X, đề cập đến cụm GPU lớn của xAI tại Memphis. “Grok 3 sẽ là một bước tiến lớn,” ông nói trong một bài đăng theo dõi vào giữa tháng 12.
Tuy nhiên, đã là ngày 2 tháng 1, và Grok 3 vẫn chưa đến - cũng như không có dấu hiệu nào cho thấy việc triển khai của nó sắp tới.
Trên thực tế, một số mã trên trang web của xAI đã bị phát hiện bởi người gợi ý AI Tibor Blaho cho thấy một mô hình trung gian, “Grok 2.5,” có thể sớm được phát hành.
Grok[.]com có thể sắp ra mắt với mô hình Grok 2.5 (grok-2-latest - “Mô hình thông minh nhất của chúng tôi”) - cảm ơn về gợi ý, người ẩn danh! pic.twitter.com/emsvmZyaf7
— Tibor Blaho (@btibor91) 20 tháng 12 năm 2024
Tất nhiên, đây không phải lần đầu tiên Musk đặt một mục tiêu cao và không đạt được nó. Đã được thiết lập rằng những tuyên bố của Musk về thời gian ra mắt sản phẩm thường không chắc chắn.
Và để công bằng, trong một cuộc phỏng vấn với người dẫn chương trình Lex Fridman vào tháng 8, Musk nói rằng Grok 3 sẽ “hy vọng” có sẵn vào năm 2024 “nếu may mắn.”
Nhưng tình trạng Grok 3 vẫn thiếu tích cực là đáng chú ý vì nó là một phần của một xu hướng tăng lên.
Năm ngoái, công ty khởi nghiệp AI Anthropic không thể cung cấp một phiên bản kế nhiệm cho mô hình hàng đầu của họ là Claude 3 Opus. Mấy tháng sau khi thông báo rằng một mô hình thế hệ tiếp theo, Claude 3.5 Opus, sẽ được phát hành vào cuối năm 2024, Anthropic loại bỏ tất cả các đề cập đến mô hình từ tài liệu phát triển của họ. (Theo một báo cáo, Anthropic đã hoàn thành việc đào tạo Claude 3.5 Opus vào cuối năm ngoái, nhưng quyết định rằng việc phát hành nó không có lý do kinh tế.)
Có thông tin cho biết, Google và OpenAI cũng đã gặp trở ngại với các mô hình hàng đầu của họ trong vài tháng gần đây.
Điều này có thể là dấu chứng cho giới hạn của các quy tắc mở rộng AI hiện tại - các phương pháp mà các công ty đang sử dụng để nâng cao khả năng của các mô hình của họ. Trong không quá xa xôi, đã có thể đạt được sự tăng hiệu suất đáng kể bằng cách đào tạo mô hình bằng lượng lớn công suất máy tính và dữ liệu lớn hơn và lớn hơn. Nhưng lợi ích từ mỗi thế hệ mô hình đã bắt đầu thu nhỏ, khiến các công ty phải tiếp tục theo đuổi các kỹ thuật thay thế.
Grok 3 đang được đào tạo với 10X, sắp tới 20X công suất so với Grok 2
— Elon Musk (@elonmusk) 21 tháng 9 năm 2024
Chính Musk đã ám chỉ điều này trong cuộc phỏng vấn với Fridman.
“Anh hy vọng Grok 3 sẽ là tốt nhất?” Fridman hỏi.
“Hy vọng,” Musk trả lời. “Tôi nghĩ, đây là mục tiêu. Chúng ta có thể thất bại với mục tiêu này. Đó là nguyện vọng.”
Có thể có những lý do khác dẫn đến việc trễ hẹn của Grok 3. xAI có một đội ngũ nhỏ hơn nhiều so với nhiều đối thủ của họ, chẳng hạn. Tuy nhiên, việc trễ thời gian ra mắt cộng thêm vào thế giới chứng cứ cho thấy các phương pháp huấn luyện AI thông thường đang đối mặt với một bức tường.