“Đôi khi… khi bạn tụt lại quá xa đến mức bị bỏ xa một vòng, bạn lại có cảm giác mình đang dẫn đầu.” – Tôi
Đó là suy nghĩ đầu tiên của tôi sau khi đọc bài viết “All gas, no brakes: tech predictions for 2026” (Hết ga, không phanh: Dự đoán công nghệ cho năm 2026) của Jeff Clarke. Các nhà lãnh đạo sẽ bị thử thách bởi cảm giác về tốc độ trong một cuộc đua AI mà đôi khi thiếu vắng những điểm tham chiếu rõ ràng.
Theo tôi, những nhận định của Jeff rất chính xác về tầm quan trọng của tốc độ, hạ tầng, vai trò của GPU trong việc xử lý sự bùng nổ token, trí tuệ ở biên (edge) và tự động hóa vật lý vào năm 2026. Vì vậy, tôi muốn thử lùi lại một bước và đặt mình vào vị trí của các “Giám đốc Cấp cao (CxO)” – những người tôi có đặc ân được gặp gỡ hàng tuần trong các chương trình tại Wharton.
Hãy nói về tốc độ.
Tốc độ là khái niệm tương đối. Làm sao bạn biết mình đang ở đâu so với đối thủ? Là một nhà lãnh đạo, bạn khó tránh khỏi việc bị giới hạn tầm nhìn trong một “ống kính” nhất định. Hãy khắc phục điều đó. Tận dụng các đối tác và nhà cung cấp đáng tin cậy. Tận dụng hàng triệu đô la tư vấn miễn phí bạn sẽ nhận được từ những công ty như Dell thông qua các buổi “vừa ăn trưa vừa học hỏi” được dẫn dắt bởi những chuyên gia mà tôi tin là thông minh hơn bất kỳ nhà phân tích nào từ các hãng tư vấn lớn. Xin lỗi nhé Jeff. Tôi vừa có thể đã làm giảm biên lợi nhuận của anh một chút. Nhưng anh sẽ bù lại được nhờ khối lượng. Vì anh chỉ mặc áo phông thôi, nên sẽ ổn thôi.
Một cách khác để mở rộng tầm nhìn, tất nhiên, là giáo dục điều hành. Tôi xin được “tự quảng cáo” một chút cho chương trình AI của tôi tại Wharton, nơi tôi được làm việc với một trong những chuyên gia thông minh nhất trong lĩnh vực AI, Giáo sư Prasanna Tambe, cùng với nhóm sinh viên và lãnh đạo tuyệt vời. Hãy tham gia cùng các đồng nghiệp trên toàn cầu và học hỏi lẫn nhau. Giá trị của những chương trình như thế này là vô cùng to lớn.
Còn hạ tầng thì sao?
Các ông lớn điện toán đám mây siêu lớn (hyperscale) đang rất muốn chúng ta “Làm Cho CNTT Trong Suốt Trở Lại” (một cách chơi chữ). Nói cách khác, họ muốn chúng ta đồng thanh hát, “Chúng tôi không quan tâm nó được xây dựng thế nào… chỉ cần cho chúng tôi thuê dịch vụ chúng tôi muốn.”
Cách tiếp cận đó sẽ không còn đủ vào năm 2026.
Trong ngành kinh doanh hạ tầng, chúng ta đã nói về việc “hồi hương” (repatriation) khối lượng công việc trong nhiều năm, nhưng chủ yếu đó là suy nghĩ viển vông. Ngày nay, nó là thật. Thật sự đấy. Suy luận (inference) và tất cả những thứ CNTT liên quan sẽ diễn ra từ lõi trung tâm dữ liệu của bạn cho đến tận các điểm biên (edge) cuối cùng trong túi sau của bạn và trong các thiết bị vật lý khác. Các quyết định sẽ cần được đưa ra về nơi cư trú của tài nguyên quý giá nhất: dữ liệu. Rất có thể, nó sẽ không phải tất cả đều nằm trong “đám mây”.
Lợi thế cạnh tranh và hệ sinh thái khép kín vào năm 2026? GPU sẽ phù hợp ở đâu?
Jeff chỉ ra rằng GPU không thể làm mọi thứ. Đó là “Mật Mã Clarke” (chơi chữ từ tên Jeff Clarke, như Morse Code) cho một điều mà ngay cả bản thân anh ấy có thể cũng chưa nhận ra đầy đủ. Dell là hiện thân của “Tư Duy Giám đốc Công nghệ (CTO)”. Tôi định nghĩa vai trò của CTO là trách nhiệm tận dụng những gì tốt nhất mà công nghệ mang lại để phục vụ sứ mệnh của tổ chức. Tại Wharton, trong chương trình CTO, chúng tôi nói về một chu kỳ thiện lành, bất tận của việc hoạch định chiến lược, quét thị trường và thực thi. Dell làm điều đó thay mặt cho khách hàng và không bị giam cầm bởi một phương pháp luận duy nhất. Các công ty như NVIDIA, nhà tiên phong về GPU, liên tục mở rộng ranh giới của những gì có thể, nên tự nhiên họ nhận được sự chú ý lớn.
Bộ tăng tốc AI, mạng lưới, lưu trữ và điện toán truyền thống đều có vai trò quan trọng. Chỉ dựa vào một hệ sinh thái khép kín duy nhất là không đủ. Thời gian để tạo ra giá trị và ROI là quan trọng, nhưng chưa đủ để bạn tự đẩy mình vào thế bí. Đừng hoảng sợ. Bạn có thời gian cho một cách tiếp cận có phương pháp.
Điều gì sẽ xảy ra với các mô hình vào năm 2026?
Đây là điều tôi đã suy nghĩ và thử nghiệm trong phòng lab tại nhà. Tôi đồng ý rằng sự chuyên môn hóa sẽ xuất hiện trong các mô hình AI vào năm 2026 và xa hơn nữa. Tôi đã công khai bày tỏ sự hoài nghi về việc tất cả điều này sẽ diễn ra trong các trung tâm dữ liệu 10GW mà chúng ta liên tục nghe nói đến. Tôi đồng ý với các đánh giá của Jeff vì tôi hiểu những gì cần thiết để vận hành một trung tâm dữ liệu 10GW. Tôi cũng biết khả năng của thiết bị trong túi tôi vào cuối năm 2025, và của máy tính để bàn. Tôi có các mô hình chạy cục bộ có thể khiến bạn kinh ngạc. Thời đại chuyên môn hóa mô hình đã bắt đầu. Điều này quay trở lại câu hỏi về GPU. Một lần nữa, tôi đồng ý rằng chúng ta không cần công nghệ mạnh nhất, ngốn nhiều điện năng nhất và đắt tiền nhất cho mọi khía cạnh của AI trong tương lai.
Còn người máy thì sao?
“AI Vật Lý” cuối cùng sẽ tạo ra một thay đổi sâu sắc hơn trong cuộc sống của chúng ta so với bất kỳ mô hình nào chỉ tồn tại trong thế giới kỹ thuật số. Tôi đã viết về “Bài Kiểm Tra Rửa Bát” (một cách chơi chữ từ “Bài Kiểm Tra Turing”), như một khoảnh khắc định nghĩa trong AI vật lý. Một đứa trẻ 10 tuổi có thể được dạy để dọn bàn ăn, dọn dẹp, rửa bát và cất chúng đi. Tôi không nghĩ chúng ta sẽ có robot gia đình làm được việc này vào năm 2026, nhưng chúng đang trên đường tới. Ở mặt trận công nghiệp, hãy theo dõi sát sao các công ty như RoboForce, những người tiếp cận với triết lý rằng có những công việc con người không nên phải làm. Những công việc nguy hiểm hơn việc rửa bát rất nhiều.
Cuối cùng, “Hết ga, không phanh”?
Vì nội dung dự đoán của anh ấy có lý, nên tôi phải trêu chọc Jeff và phân tích sâu cụm từ đó. Trên đường đua, bạn đạt được thời gian vòng nhanh nhất không chỉ bằng cách sử dụng ga VÀ phanh hiệu quả, mà còn bằng cách sử dụng vô-lăng (cùng với ga và phanh) để tìm ra đường đua tối ưu. Đó không phải là một hoạt động dùng sức mạnh thuần túy. Một tay đua giỏi điều khiển vô-lăng một cách nhẹ nhàng và tinh tế. Mượt mà chính là nhanh. Các nhà lãnh đạo sẽ cần phớt lờ những áp lực của FOMO (nỗi sợ bỏ lỡ) và FOFU (nỗi sợ làm hỏng việc) để trở thành những người vận hành mượt mà.
Phần thưởng đặc biệt cho những ai đã đọc đến tận đây.
Ở cấp độ vĩ mô, tôi dự đoán rằng vào cuối năm 2026, chúng ta sẽ thấy bằng chứng không thể chối cãi về sự phân tán lợi nhuận trong thị trường AI. Các nhà cung cấp điện toán đám mây siêu lớn, các OEM hạ tầng lai hàng đầu và hàng trăm startup sẽ tiếp tục tấn công vào sự tập trung lợi nhuận đã hình thành trong lĩnh vực AI. Nếu bạn đọc đến tận đây, tôi không cần phải chỉ đích danh ai cả.
Giờ thì tôi sẽ xem Talladega Nights. Một lần nữa.
Tags: AI Race, AI Strategy, Edge Computing, AI Infrastructure, AI Predictions 2026, Physical AI, AI Leadership







