OpenAI hợp tác với Broadcom đã công bố Jalapeño, một bộ xử lý được thiết kế riêng cho việc suy luận (inference) của các mô hình ngôn ngữ lớn (LLM). Chip này là mẫu đầu tiên trong loạt bộ tăng tốc AI mà hai công ty đang cùng phát triển. Mục tiêu là hỗ trợ các workload AI tiên tiến và mở rộng khả năng kiểm soát nội bộ của OpenAI đối với hạ tầng cốt lõi đằng sau các mô hình và sản phẩm của mình.
Jalapeño đã được Chủ tịch kiêm Giám đốc Điều hành Broadcom, Hock Tan, và Giám đốc Giải pháp Bán dẫn Broadcom, Charlie Kawwas, trao cho CEO OpenAI Sam Altman và Chủ tịch Greg Brockman.
Brockman – đồng sáng lập OpenAI – cho biết:
“The world is shifting to a compute‑powered economy.
Jalapeño is part of our long‑term full‑stack infrastructure strategy, making compute richer, so AI can be faster, more reliable, lower‑cost for both consumers and enterprises, and tackle more important problems.
By designing more layers in the stack ourselves, we can deliver higher‑performance intelligence while continuing to bring advanced AI closer to a broader set of users.”
Jalapeño là thiết kế tùy chỉnh, được phát triển dựa trên hiểu biết của OpenAI về hoạt động của LLM, yêu cầu của các mô hình tương lai, hạ tầng phần mềm và nhu cầu sản phẩm. Chip hướng tới việc hỗ trợ cả các LLM hiện tại và tương lai, bao gồm các nền tảng của OpenAI như ChatGPT, Codex, API và các sản phẩm dựa trên agent đang được triển khai.
Quá trình thiết kế Jalapeño được thực hiện chung giữa OpenAI, Broadcom và Celestia. Broadcom chịu phần thực thi chip, khả năng kết nối mạng và sản xuất silicon, trong khi Celestia phụ trách tích hợp bảng mạch và hệ thống giá đỡ rack, kết nối mạng và phát triển hệ thống sản xuất có khả năng mở rộng. Các mẫu kỹ thuật sớm hiện đang chạy các workload học máy ở tần số và mức tiêu thụ điện năng mục tiêu trong các phòng thí nghiệm của OpenAI, bao gồm các mô hình nội bộ như GPT‑5.3‑Codex‑Spark.
Kiến trúc của bộ xử lý được mô tả là blank‑slate (từ đầu), không dựa trên các bộ tăng tốc AI hay giải pháp đa năng trước đó, mà được tùy chỉnh hoàn toàn cho nhu cầu suy luận LLM. OpenAI cho biết chip được thiết kế linh hoạt cho mọi LLM, dựa trên những hiểu biết sâu sắc về yêu cầu suy luận của các mô hình hiện tại và sắp tới trong toàn ngành. Jalapeño dự kiến sẽ đạt hiệu suất năng lượng cao hơn đáng kể so với phần cứng tương đương hiện có. Việc thử nghiệm ban đầu đang diễn ra, và OpenAI sẽ công bố báo cáo kỹ thuật chi tiết trong vài tháng tới.
Kiến trúc chip nhằm giảm thiểu việc di chuyển dữ liệu không cần thiết và cân bằng tài nguyên tính toán, bộ nhớ và mạng, hướng tới thu hẹp khoảng cách giữa hiệu năng lý thuyết và thực tế đạt được.
Bộ vi xử lý mạng Tomahawk của Broadcom là một thành phần của hạ tầng cho phép nền tảng Jalapeño mở rộng quy mô khi triển khai lớn. Quá trình phát triển Jalapeño mất chín tháng, từ khâu thiết kế ban đầu tới việc tape‑out – một thời gian mà OpenAI và Broadcom cho là nhanh nhất đối với một ASIC cao cấp trong ngành. Tốc độ này được hỗ trợ nhờ sự cộng tác chặt chẽ giữa phần mềm và phần cứng, cùng việc sử dụng các mô hình AI nội bộ của OpenAI để hỗ trợ một số công đoạn thiết kế và tối ưu hoá chip.
Hai công ty mô tả Jalapeño là thành phần đầu tiên của một nền tảng tính toán đa thế hệ, dự kiến sẽ được triển khai ban đầu vào cuối năm 2026. Chủ tịch kiêm Giám đốc Điều hành Broadcom, Hock Tan, phát biểu:
“Our partnership with OpenAI demonstrates a commitment to physical‑layer platforms that will scale AI for the next decade. This is just the beginning of a multi‑generation roadmap. By co‑developing our leading‑edge silicon with OpenAI, we are enabling gigawatt‑scale data centers with Microsoft and other partners to go live in 2026.”
Jalapeño sẽ tiếp tục mở rộng, kết hợp các bộ tăng tốc do OpenAI thiết kế, silicon và công nghệ mạng của Broadcom, cùng kinh nghiệm về hệ thống giá đỡ rack, hệ thống và kết nối mạng của Celestia. Mục tiêu thiết kế là đạt công suất tính toán và thông lượng tương đương các bộ tăng tốc AI hiện tại, đồng thời đạt độ trễ gần với các giải pháp suy luận chuyên dụng, hướng tới các sản phẩm LLM tương tác có khả năng mở rộng.
OpenAI cũng cho biết các mô hình hiện đang được dùng để phục vụ khách hàng đang được tận dụng nội bộ để cải thiện phần cứng và hệ thống cho các workload AI trong tương lai. Công ty nhấn mạnh rằng nếu AI có thể hỗ trợ các kỹ sư tạo chip nhanh hơn và hiệu quả hơn, sẽ giảm chi phí tính toán cho toàn ngành và mở rộng truy cập vào hạ tầng AI tiên tiến.
Đầu tháng này, OpenAI đã đệ trình hồ sơ bảo mật với Ủy ban Chứng khoán và Giao dịch Mỹ (SEC) cho khả năng thực hiện IPO. Nhà phát triển ChatGPT vẫn chưa quyết định số lượng cổ phiếu, mức giá tiềm năng, hay thời gian cụ thể, và cho biết các cuộc thảo luận nội bộ vẫn đang diễn ra.
Bài viết “OpenAI partners with Broadcom to launch Jalapeño intelligence chip” được soạn và công bố lần đầu bởi Verdict, một thương hiệu thuộc GlobalData.
OpenAI, AI chip, Broadcom







