Kỷ nguyên Vera Rubin đã chính thức bắt đầu khi nền tảng AI nhanh nhất không chỉ của NVIDIA mà còn của toàn ngành công nghệ đang được bàn giao tới các nhà cung cấp dịch vụ đám mây hàng đầu. CoreWeave và Oracle nhận những hệ thống NVIDIA Vera Rubin NVL72 đầu tiên để kiểm thử và xác thực, mở ra bước nhảy vọt cho Agentic AI.
Mặc dù Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt, các nhà cung cấp hạ tầng AI Cloud hàng đầu đã sớm nhận được những hệ thống đầu tiên để tiến hành thử nghiệm và xác thực cùng NVIDIA. Trước đó, NVIDIA cũng đã gửi những bộ xử lý Vera CPU đầu tiên tới các công ty AI lớn vào tháng trước.
Oracle và CoreWeave là hai trong số những nhà cung cấp dịch vụ đám mây đầu tiên triển khai nền tảng NVIDIA Vera Rubin NVL72. Các hệ thống này sẽ được kiểm thử chặt chẽ cùng NVIDIA nhằm tối ưu hiệu năng AI thế hệ mới ở cấp độ tiên phong.
Ông Mahesh Thiagarajan, Phó Chủ tịch Điều hành phụ trách Oracle Cloud Infrastructure, là người đầu tiên chia sẻ hình ảnh giá máy (rack) NVL72 khổng lồ, được trang bị 72 GPU Rubin và 36 CPU Vera. Đây là những thành phần phần cứng AI cao cấp nhất hiện nay và được kỳ vọng sẽ trở thành thành công tiếp theo của NVIDIA sau Grace Blackwell, nền tảng vừa tiếp tục lập nhiều kỷ lục AI trong kết quả đánh giá MLPerf 6.0 được công bố gần đây.

Như CEO Jensen Huang từng chia sẻ, AI là một "chiếc bánh năm tầng" (five-layer cake), và hệ thống Vera Rubin chỉ là một trong những lớp cấu thành. Đằng sau đó là toàn bộ hạ tầng được thiết kế chính xác để cung cấp điện năng, làm mát, kết nối tốc độ cao, mạng và nhiều thành phần khác. Bên cạnh phần cứng là hệ sinh thái phần mềm mà NVIDIA đã xây dựng trong nhiều năm qua, đạt mức độ phổ biến và thành công mà hiện vẫn chưa có đối thủ nào có thể tái tạo. Đó là nền tảng CUDA và đối với AI là CUDA-X.
Hệ thống thứ hai được triển khai tại CoreWeave và được giới thiệu bởi ông Jacob Yundt, Giám đốc Cấp cao phụ trách Kiến trúc Điện toán. CoreWeave cũng chia sẻ toàn bộ quá trình đưa hệ thống từ xe tải vào trung tâm dữ liệu. Phải cần từ ba đến bốn người mới có thể di chuyển một rack vào bên trong, cho thấy quy mô đồ sộ của mỗi hệ thống. Và đó mới chỉ là một rack, trong khi các AI Factory trong tương lai sẽ triển khai hàng trăm nghìn rack như vậy.
CoreWeave cũng đặt những cái tên khá thú vị cho bộ phần mềm quản lý hệ thống làm mát bằng chất lỏng và nền tảng điều khiển rack hợp nhất của mình là Valvey và Racky. Theo CoreWeave, họ là đơn vị đầu tiên hoàn tất việc khởi tạo và xác thực nền tảng NVIDIA Vera Rubin NVL72.
Như đã đề cập trước đó, nền tảng Vera Rubin đang có khởi đầu rất ấn tượng. NVIDIA cho biết hệ thống này có thể huấn luyện các mô hình Mixture of Experts (MoE) chỉ với một phần tư số lượng GPU so với Blackwell, đồng thời giảm chi phí suy luận trên mỗi token xuống chỉ còn một phần mười. Hiện Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt và quý III sẽ đánh dấu thời điểm các hệ thống Agentic AI mạnh mẽ này chính thức đi vào vận hành thực tế.



good
Awesome
Nice