Mac mini của Apple luôn là chiếc máy để bàn yên lặng, không gây ấn tượng ở góc cuối của Apple Store—thực dụng, giá rẻ theo tiêu chuẩn của Apple và hầu như không được cộng đồng AI chú ý. Rồi OpenClaw xuất hiện.
Vào thứ Năm, Tim Cook thông báo với các nhà phân tích rằng Mac mini và Mac Studio đã “được bán hết”—và có thể sẽ duy trì tình trạng này trong vài tháng. “Cả hai đều là nền tảng tuyệt vời cho AI và các agent AI,” ông nói trong buổi gọi báo cáo tài chính Q2 2026 của Apple, “và nhận thức của khách hàng về chúng đang diễn ra nhanh hơn dự đoán của chúng tôi.”
Apple đã đánh giá sai mức độ nhu cầu của các nhà phát triển đối với những chiếc máy này, nhất là khi tình trạng khan hiếm đang làm xáo trộn thị trường.
Doanh thu Mac đạt 8,4 tỷ USD trong quý, tăng 6 % so với cùng kỳ năm ngoái. Yếu tố hạn chế không phải là nhu cầu mà là khả năng cung ứng. Các cấu hình Mac mini và Mac Studio có RAM cao không chỉ bị trì hoãn; một số còn bị gỡ hoàn toàn khỏi Apple Store.
- Phiên bản Mac mini cơ bản 599 USD đã “được bán hết” tại Mỹ và không còn tùy chọn giao hàng hay nhận hàng tại cửa hàng.
- Các cấu hình nâng cấp với 64 GB RAM có thời gian chờ từ 16–18 tuần.
- Các mẫu Mac Studio với 512 GB bộ nhớ hợp nhất đã biến mất khỏi cửa hàng.
- Những người bán lậu trên eBay đang niêm yết các mẫu cơ bản với giá gần gấp đôi giá bán lẻ.
The catalyst: OpenClaw và làn sóng AI dạng agent tiêu thụ nhiều bộ nhớ.
Khung công tác AI agent mã nguồn mở—được xây dựng bởi Peter Steinberger và hiện được OpenAI hỗ trợ sau một cuộc đấu giá với Meta—đã bùng nổ lên hơn 323 000 sao trên GitHub và trở thành cách nhanh nhất để các cá nhân và nhóm nhỏ chạy các AI agent liên tục trên máy cục bộ. Phần cứng tham chiếu không chính thức để chạy nó ngay lập tức trở thành Mac mini.
Đây không phải là kết quả của một chiến dịch marketing.
Điều mà hầu hết người đưa tin về tình trạng thiếu hụt Mac bỏ qua là Apple đã không liên quan tới các khối lượng công việc AI nghiêm trọng trong nhiều năm. Trước khi các AI agent trở nên phổ biến, việc chạy LLM, Stable Diffusion hay bất kỳ phần mềm AI gia đình nào đều rất chậm và gần như không thể sử dụng. Một chiếc M2 Mac có hiệu năng tương đương một GPU năm 2019. Việc Apple từ chối áp dụng CUDA hay sử dụng Nvidia, đồng thời đẩy mạnh công nghệ MLX riêng, đã khiến nó trở nên vô dụng cho AI cũng như cho gaming.
Bí mật “bẩn” của CUDA: giới hạn VRAM. Ngay cả GPU tiêu dùng cao cấp nhất của Nvidia, RTX 5090, cũng chỉ có tối đa 32 GB VRAM. Các mô hình lớn hơn sẽ tràn sang RAM hệ thống chậm hơn, làm giảm hiệu năng. Chạy một mô hình 70 tỷ tham số trên phần cứng Nvidia đòi hỏi nhiều GPU, một rack server, tiêu thụ điện năng lớn và chi phí hàng ngàn USD.
Kiến trúc Unified Memory (UMA) của Apple giải quyết vấn đề này theo cách mà CUDA không thể. Trên Apple Silicon, CPU, GPU và Neural Engine cùng chia sẻ một kho RAM vật lý duy nhất—không có VRAM riêng và không cần băng PCIe để chuyển dữ liệu. Một Mac mini với 64 GB RAM có thể tải một mô hình 70 tỷ tham số; trong khi RTX 5090, dù có giá khoảng 1.800 USD, thậm chí không thể sánh kịp.
Chip M4 Ultra—chip cung cấp năng lực cho các cấu hình cao cấp của Mac Studio—hỗ trợ tới 192 GB bộ nhớ hợp nhất, đủ để chạy các mô hình 100 tỷ tham số trên một máy duy nhất. Không cần server, không cần chi phí đám mây hàng tháng.
OpenClaw đã làm cho điểm cân bằng này trở nên rõ ràng. Vì nó chạy các agent trên máy cục bộ—kết nối tới tệp, ứng dụng và tin nhắn của người dùng—người dùng cần những máy có khả năng xử lý tải suy luận mà không phải thuê máy tính đám mây. Một Mac mini với 32 GB bộ nhớ hợp nhất có thể chạy các mô hình 30 tỷ tham số một cách thoải mái. Một Mac Studio với 128 GB có thể xử lý các mô hình mà hầu hết nhà phát triển một năm trước không thể chạm tới nếu không có cụm GPU doanh nghiệp.
Kết quả: các nhà phát triển bắt đầu mua Mac mini như mua Raspberry Pi—mua nhiều đơn vị cùng lúc, coi chúng như hạ tầng thay vì máy tính cá nhân. Chuỗi cung ứng của Apple chưa bao giờ được thiết kế cho mô hình mua sắm như vậy.
Một tình trạng thiếu hụt bộ nhớ toàn cầu làm vấn đề trở nên trầm trọng hơn. IDC dự báo số lượng PC toàn cầu sẽ giảm 11,3 % trong năm 2026, một phần do thiếu hụt chip bộ nhớ do nhu cầu server AI. Apple hiện đang cạnh tranh cùng các hyperscaler xây dựng trung tâm dữ liệu để giành nguồn RAM.
Cook cho biết có thể mất “vài tháng” để cân bằng lại cung và cầu cho Mac mini và Studio. Dự kiến sẽ có bản làm mới chip M5 vào cuối năm 2026, có thể giảm áp lực—nhưng những người mua hiện tại vẫn phải chờ đợi hoặc trả giá cao cho người bán lậu.
Mac mini đã tạo ra mức độ khẩn trương cao nhất trong năm 2026, hơn bất kỳ thời điểm nào trong 20 năm lịch sử của nó—và tất cả chỉ cần một cú đẩy từ một dự án mã nguồn mở mà Apple không hề tham gia.
Mac mini, AI agents, OpenClaw







