Nvidia Vera Rubin AI chip platform bước vào sản xuất toàn diện

**Nvidia Vera Rubin AI chip platform bước vào sản xuất toàn diện**

Nvidia just announced the chip that will power the next generation of AI hero image

Nvidia đã công bố thứ Hai việc nền tảng hạ tầng AI Vera Rubin đang chuyển sang sản xuất đầy đủ, với các hệ thống dự kiến sẽ được giao cho các khách hàng doanh nghiệp và các nhà cung cấp đám mây vào mùa thu này. Thông báo này được đưa ra trong bài phát biểu khai mạc của CEO Jensen Huang tại hội nghị Computex ở Đài Bắc.

Nền tảng Vera Rubin được thiết kế để phục vụ các khối tải “agentic AI” – những hệ thống AI tự động có khả năng suy luận, sử dụng công cụ phần mềm của bên thứ ba và thực hiện các nhiệm vụ phức tạp thay mặt con người. Nvidia cho biết nền tảng này đạt hiệu năng agentic AI gấp 10 lần so với nền tảng thế hệ trước Grace Blackwell, đồng thời chi phí trên mỗi token giảm còn bằng 1/10.

Trung tâm của nền tảng là GPU Rubin mới và CPU Vera. Nvidia xác nhận CPU Vera đã vào sản xuất toàn diện. CPU này dựa trên kiến trúc lõi tùy chỉnh Olympus, gồm 88 lõi và bộ nhớ LPDDR5X có băng thông lên tới 1,2 TB/s. Theo Nvidia, chip này nhanh hơn các bộ xử lý dựa trên x86 tới 1,8 lần trong các tác vụ cốt lõi của các triển khai agentic, chẳng hạn truy vấn cơ sở dữ liệu và biên dịch mã.

“Các tác nhân AI sẽ là người dùng máy tính lớn nhất,” Jensen Huang nói. “Vera là CPU đầu tiên được thiết kế cho tương lai đó — được xây dựng để chạy agentic AI ở quy mô siêu lớn với hiệu suất, năng lực và khả năng lập trình phi thường.”

Ở vị trí cao nhất trong danh mục sản phẩm, hệ thống Vera Rubin NVL72 kết hợp 36 CPU Vera và 72 GPU Rubin trong một rack làm mát bằng dung dịch, tất cả được liên kết qua NVLink 6 – kết nối tốc độ cao, theo SiliconAngle. Đào tạo các mô hình mixture‑of‑experts quy mô lớn trên NVL72 chỉ cần một phần tư số GPU so với khi dùng thế hệ Blackwell trước đây, công ty cho biết.

Bí mật:  Đừng Vội Làm Portfolio ML Nếu Thiếu Những Dự Án Sau

Các khách hàng sớm dự định triển khai Vera bao gồm các nhà phát triển AI như Anthropic, OpenAI và xAI của SpaceX, cùng các nhà cung cấp đám mây CoreWeave, ByteDance và Oracle Cloud Infrastructure. Các nhà sản xuất máy chủ Dell Technologies, HPE, Lenovo và Supermicro đang xây dựng các hệ thống Vera Rubin ở quy mô lớn.

Bổ sung cho nền tảng là bộ xử lý lưu trữ BlueField‑4 STX, mà Nvidia định vị như một lớp ngữ cảnh vững chắc giúp các tác nhân AI duy trì tính nhất quán qua các cuộc hội thoại dài, đa bước. Nvidia cho biết việc chuyển ngữ cảnh được lưu trong bộ nhớ đệm qua chip BlueField‑4 thay cho hệ thống chính có thể nâng tốc độ suy luận lên tới năm lần.

Việc sản xuất nền tảng dựa trên chuỗi cung ứng toàn cầu trải rộng 30 quốc gia và hơn 350 đối tác, theo SiliconAngle. Trên thị trường cạnh tranh, Vera sẽ tham gia vào lĩnh vực máy chủ AI, hiện đang do các bộ vi xử lý Xeon của Intel, dòng EPYC của AMD và các silicon tùy chỉnh được phát triển nội bộ bởi các nhà cung cấp đám mây lớn chiếm ưu thế, theo Bloomberg.

Nvidia, AI hardware, Vera Rubin

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top