OpenAI vừa công bố Jalapeño, bộ xử lý AI tự thiết kế đầu tiên của mình, được phát triển phối hợp cùng Broadcom để chạy các mô hình ngôn ngữ lớn (LLM) làm nền tảng cho ChatGPT. Khác với các bộ xử lý đồ họa (GPU) hiện đang chi phối hạ tầng AI, Jalapeño được thiết kế từ đầu cho một nhiệm vụ duy nhất: trả lời các câu hỏi của người dùng nhanh nhất và hiệu quả nhất. Động thái này có thể làm cho ChatGPT nhanh hơn, giảm chi phí vận hành và tăng độ ổn định trong những năm tới.
Why OpenAI Built Its Own Chip
Nvidia vẫn là nhà thống trị không thể tranh cãi trong lĩnh vực phần cứng AI, cung cấp các GPU dùng để huấn luyện và chạy nhiều hệ thống AI tiên tiến nhất thế giới. Các chip này được thiết kế để đáp ứng đa dạng các khối lượng công việc, chứ không chỉ riêng việc phục vụ hàng tỉ phản hồi chatbot mỗi ngày.
Jalapeño lại đi theo một hướng khác. Thay vì là bộ xử lý đa năng, nó là inference chip, nghĩa là phần cứng được tối ưu riêng cho việc sinh ra câu trả lời sau khi mô hình AI đã được đào tạo — chính là khâu bạn tương tác mỗi khi đặt câu hỏi cho ChatGPT.
Theo OpenAI và Broadcom (theo nguồn tin Reuters), chip mới được kiến trúc quanh các mẫu bộ nhớ, mạng và tính toán mà các large language model hiện đại sử dụng, cho phép thực hiện những công việc này hiệu quả hơn so với phần cứng truyền thống. Các thử nghiệm nội bộ ban đầu cho thấy nó đem lại hiệu suất năng lượng (performance‑per‑watt) tốt hơn so với các AI accelerator hàng đầu hiện nay, mặc dù chưa có bản benchmark độc lập nào được công bố.
Why This Matters for ChatGPT Users
Nếu OpenAI có thể trả lời nhiều câu hỏi hơn đồng thời tiêu thụ ít điện năng và ít chip đắt tiền, chi phí hoạt động của ChatGPT sẽ thay đổi. Điều này không đồng nghĩa với việc gói ChatGPT Plus của bạn sẽ ngay lập tức giảm giá, nhưng chi phí hạ tầng thấp hơn có thể cho phép OpenAI:
- Trả lời câu hỏi nhanh hơn
- Hỗ trợ nhiều người dùng hơn trong giờ cao điểm
- Giảm thiểu sự cố do thiếu hụt phần cứng
- Ra mắt các mô hình AI mạnh hơn mà không làm tăng đáng kể chi phí vận hành
Nói cách khác, ngoài việc xây dựng một con chip nhanh hơn, OpenAI đang làm cho ChatGPT có khả năng mở rộng cao hơn.
OpenAI Is Becoming More Vertically Integrated
Cho đến nay, OpenAI phần lớn dựa vào các đối tác cung cấp phần cứng cho hệ thống AI của mình. Khi tự thiết kế bộ xử lý đồng thời tiếp tục phát triển mô hình và sản phẩm, công ty dần kiểm soát được nhiều hơn trong toàn bộ stack AI.
Đây là một chiến lược đã được nhiều công ty công nghệ áp dụng: tự thiết kế phần cứng và phần mềm có thể tối ưu lẫn nhau, nâng cao hiệu suất đồng thời giảm chi phí dài hạn. OpenAI mô tả Jalapeño là bước đầu trong một nền tảng tính toán đa thế hệ, ám chỉ đây sẽ không phải là bộ xử lý được thiết kế riêng cuối cùng. Động thái này nhằm giảm phụ thuộc vào một nhà cung cấp duy nhất và cắt giảm một trong những khoản chi tiêu lớn nhất của OpenAI.
Nvidia vẫn thống trị việc training AI, và OpenAI vẫn tiếp tục dùng phần cứng Nvidia trên phần lớn hạ tầng của mình. Jalapeño được thiết kế cho inference, không phải thay thế mọi GPU trong các trung tâm dữ liệu của OpenAI.
The Takeaway
AI thực sự đã góp phần vào việc thiết kế chip. OpenAI cho biết Jalapeño từ khái niệm tới bản thiết kế sẵn sàng sản xuất chỉ mất chín tháng — một thời gian ngắn bất thường đối với việc phát triển bán dẫn cấp cao.
Điều này nhắc chúng ta rằng AI không còn chỉ viết mã nữa; ngày càng nhiều AI đang hỗ trợ các kỹ sư xây dựng phần cứng mà các hệ thống AI tương lai sẽ chạy trên đó. Hầu hết người dùng sẽ không bao giờ thấy Jalapeño, nhưng họ sẽ cảm nhận được kết quả mỗi khi ChatGPT trả lời nhanh hơn, phục vụ nhiều người hơn, hoặc mở ra những khả năng trước đây quá tốn kém để vận hành.
OpenAI, AI hardware, Jalapeño







