Định nghĩa AGI: Jensen Huang, Lex Fridman, DeepMind, Turing và hệ thống phân loại nhận thức

Hình ảnh: Jensen Huang tại buổi podcast
Giám đốc điều hành Nvidia, Jensen Huang, đã nói vào tuần trước rằng “AGI đã được đạt được.” Các bài báo nghiên cứu gần đây lại khẳng định rằng AGI vẫn chưa đạt được, và đồng thời đề xuất những phương pháp mới để đo lường nó. (Kent Nishimura—Bloomberg—Getty Images)
Tuần trước, Nvidia (https://fortune.com/company/nvidia/) CEO của Nvidia, Jensen Huang, đã gây chú ý khi ông nói (https://youtu.be/vif8NQcjVf0?si=1YmN9Knb_l_cx1Hf) với podcaster Lex Fridman rằng AGI – trí tuệ nhân tạo tổng quát – đã đạt được.
AGI từ lâu đã là mục tiêu tối thượng của rất nhiều nhà nghiên cứu trí tuệ nhân tạo, mặc dù không có một định nghĩa nào được chấp nhận đồng nhất cho thuật ngữ này. Thông thường, nó chỉ các hệ thống AI có trí thông minh ngang bằng con người, nhưng vẫn có một cuộc tranh luận sôi nổi về cách định nghĩa và đo lường “trí thông minh”.
Trong trường hợp này, Fridman đã đưa ra cho Huang một thước đo khá bất thường cho AGI: Liệu AI có thể khởi nghiệp và phát triển một doanh nghiệp công nghệ đến khi nó có giá trị 1 tỷ USD? Fridman hỏi Huang liệu AGI theo định nghĩa này có thể đạt được trong vòng năm tới đến 20 năm không. Huang trả lời rằng ông không nghĩ cần một khoảng thời gian như vậy. “Tôi nghĩ ngay bây giờ. Chúng tôi đã đạt được AGI,” ông nói. Ông sau đó giảm nhẹ lời, lưu ý rằng công ty không nhất thiết phải giữ giá trị đó mãi mãi. “Bạn nói một tỉ,” Huang trả lời Fridman, “và bạn không nói mãi mãi.”
—

Nỗ lực đo lường AGI

Thực tế, chỉ vài ngày trước khi Fridman phát sóng podcast, các nhà nghiên cứu tại Google DeepMind (https://fortune.com/company/alphabet/) – trong đó có đồng sáng lập DeepMind Shane Legg, người đã giúp đưa thuật ngữ AGI ra công chúng vào đầu những năm 2000 – đã công bố một bài báo mới đề xuất một cách khoa học hơn để định nghĩa và đánh giá liệu các mô hình AI đã đạt được trí tuệ tổng quát hay chưa. Bài báo, “Measuring Progress Toward AGI: A Cognitive Framework,” dựa trên hàng chục năm nghiên cứu trong tâm lý học, thần kinh học và khoa học nhận thức để xây dựng cái mà các tác giả gọi là Hệ thống Phân loại Nhận thức (Cognitive Taxonomy).
Hệ thống phân loại này xác định mười năng lực nhận thức chủ chốt – bao gồm nhận thức, lý luận, trí nhớ, học tập, chú ý và nhận thức xã hội – mà các nhà nghiên cứu cho là thiết yếu cho trí thông minh tổng quát. Khung này sau đó đề xuất đánh giá các hệ thống AI trên tất cả mười năng lực và so sánh hiệu suất của chúng với một mẫu đại diện của người trưởng thành có trình độ ít nhất tương đương giáo dục trung học phổ thông.
Điểm sáng của bài báo là các mô hình AI hiện tại có “hồ sơ nhận thức gồ ghề”: chúng có thể vượt trội hơn hầu hết con người ở một số lĩnh vực (ví dụ: toán học hay ghi nhớ dữ kiện) trong khi tụt hẳn so với người trung bình ở những lĩnh vực khác (ví dụ: học từ kinh nghiệm, duy trì trí nhớ dài hạn, hay hiểu các tình huống xã hội). Để được coi là AGI, một mô hình AI cần ít nhất đạt mức trung bình của con người trên tất cả mười lĩnh vực, theo đề xuất của các nhà nghiên cứu DeepMind.
Các nhà nghiên cứu cũng công bố một cuộc thi với quỹ thưởng 200.000 USD trên Kaggle để các nhà nghiên cứu bên ngoài giúp xây dựng các tiêu chuẩn đánh giá cho năm năng lực nhận thức mà các bộ kiểm tra hiện tại còn yếu nhất.
Bài báo của DeepMind chỉ là một trong chuỗi nỗ lực gần đây nhằm đưa việc đo lường trí thông minh lên một nền tảng khoa học hơn.

Năm ngoái, một nhóm do Dan Hendrycks ở Trung tâm An toàn AI dẫn đầu, cùng với nhà tiên phong trong lĩnh vực học sâu Yoshua Bengio, đã công bố khung và các chỉ số AGI riêng của họ. Bài báo này cũng chia trí thông minh tổng quát thành mười miền nhận thức, dựa trên khung trí thông minh của con người được phát triển bởi các nhà tâm lý học Raymond Cattell, John Horn và John Carroll. Nó tạo ra “Điểm AGI” cho các mô hình AI hiện có; hệ thống mạnh nhất được kiểm tra, GPT‑5 của OpenAI (ra mắt tháng 8 2025), chỉ đạt 57 %, xa rời việc sánh ngang với một người trưởng thành có học vấn đầy đủ trên mọi khía cạnh nhận thức.
Một trong những nỗ lực thực tiễn tham vọng nhất nhằm chỉ ra những gì AI ngày nay vẫn chưa làm được là bộ chuẩn ARC‑AGI, do nhà nghiên cứu học máy François Chollet tạo ra. Chollet cho rằng trí thông minh nên được đo không phải bằng những gì một hệ thống đã biết, mà bằng khả năng học nhanh các kỹ năng mới. Bộ chuẩn này gồm các câu đố hình ảnh dạng lưới ô màu. Mỗi câu đố cung cấp một vài ví dụ về một lưới đầu vào được biến đổi thành lưới đầu ra theo một quy tắc ẩn; người giải phải suy ra quy tắc và áp dụng nó cho một lưới mới. Đối với con người, việc nắm bắt mẫu thường chỉ mất vài giây; đối với các mô hình AI tiên tiến, những câu đố này vẫn rất khó vì chúng đòi hỏi lý luận trừu tượng linh hoạt mà các hệ thống hiện tại chưa đạt.

Bí mật: OpenAI giảm một nửa giá gói ChatGPT Pro

Tháng này, Chollet và các đồng cộng tác viên đã ra mắt ARC‑AGI‑3, phiên bản mới và khó nhất của bộ chuẩn. Khác với các phiên bản trước chỉ đưa ra các câu đố tĩnh, ARC‑AGI‑3 là tương tác: các tác nhân AI phải khám phá môi trường mới, tự thiết lập mục tiêu, xây dựng mô hình thế giới linh hoạt và học liên tục qua nhiều bước – những khả năng mà con người thực hiện một cách tự nhiên nhưng vẫn là thách thức của nghiên cứu AI.
Tổng hợp lại, những bộ chuẩn mới này phản ánh một nỗ lực ngày càng tăng trong cộng đồng nghiên cứu AI nhằm thay thế các định nghĩa mơ hồ về AGI bằng những tiêu chuẩn gần gũi hơn với các phương pháp đo lường khoa học. Tuy nhiên, như các nhà nghiên cứu thừa nhận, việc định nghĩa trí thông minh đã là một bài toán từ thời đầu của tư duy học thuật và đã “cướp” trí tuệ nhân tạo ngay từ những ngày đầu thành lập.
—

Định nghĩa trí thông minh

Năm 1950, trước khi thuật ngữ “trí tuệ nhân tạo” được đặt ra, nhà toán học và người tiên phong máy tính người Anh Alan Turing đã đối mặt với việc đưa ra một định nghĩa cho trí thông minh. Thay vì cố gắng định nghĩa, Turing đề xuất một bài kiểm tra gọi là Trò chơi bắt chước (Imitation Game), sau này được biết đến rộng rãi là Bài kiểm tra Turing. Theo bài kiểm tra, một máy được coi là thông minh khi nó có thể duy trì một cuộc trò chuyện bằng văn bản với con người và một giám khảo người thứ hai không thể xác định chắc chắn ai là máy, ai là người.
Bài kiểm tra Turing nhanh chóng gặp phải các vấn đề. Các chatbot sớm như ELIZA (giữa những năm 1960) chỉ sử dụng các quy tắc cứng để mô phỏng một nhà trị liệu và có thể lừa một số người dùng mặc dù hầu như không hiểu ngôn ngữ. Những bot tinh vi hơn như Eugene Goostman đã đạt giải một cuộc thi Turing trực tiếp vào năm 2014, nhưng vẫn không sở hữu hầu hết các kỹ năng nhận thức của con người. Các mô hình ngôn ngữ lớn ngày nay trò chuyện lưu loát hơn ELISA, nhưng vẫn không thể sánh ngang với con người trên toàn bộ phổ năng lực nhận thức – chúng vẫn “ảo tưởng” dữ kiện, gặp khó khăn trong lập kế hoạch dài hạn và không học được từ kinh nghiệm như một người.
Thuật ngữ “trí tuệ nhân tạo tổng quát” (AGI) mới xuất hiện vào năm 1997 bởi Mark Gubrud, một sinh viên cao học tại Đại học Maryland, trong một bài viết mô tả “artificial general intelligence” như những hệ thống AI có thể “cạnh tranh hoặc vượt trội so với não bộ con người về độ phức tạp và tốc độ, có thể thu nhận, thao tác và lý luận với kiến thức chung, và có thể được sử dụng trong bất kỳ giai đoạn nào mà trí thông minh con người thường cần.” Bài viết sau đó lặng lẽ trôi qua.
Đầu những năm 2000, Shane Legg (đồng sáng lập DeepMind) độc lập đưa ra cùng thuật ngữ khi hợp tác với các nhà khoa học máy tính Ben Goertzel, Cassio Pennachin và những người khác. Họ muốn có một thuật ngữ phân biệt tham vọng của các hệ thống này với các thuật toán học máy hẹp thời bấy giờ, chỉ giải quyết một nhiệm vụ đơn lẻ. Legg đề xuất “artificial general intelligence” (AGI), và viết tắt này đã bám theo.
Goertzel sau này định nghĩa AGI là “các hệ thống AI có mức độ tự hiểu và tự kiểm soát hợp lý, có khả năng giải quyết đa dạng các vấn đề phức tạp trong nhiều bối cảnh, và có khả năng học để giải quyết những vấn đề mới mà chúng chưa biết khi được tạo ra.” Định nghĩa này hữu ích để tách biệt công việc về AI tổng quát với các mô hình học máy hẹp, nhưng vẫn còn nhiều mơ hồ: “mức độ hợp lý” là bao nhiêu? “Các vấn đề phức tạp” nào được tính?
Legg lại đưa ra một định nghĩa giản dị hơn: “Tôi định nghĩa AGI là một tác nhân nhân tạo có thể thực hiện các hoạt động nhận thức mà con người thường làm được. Tôi xem đây là rào cản tối thiểu tự nhiên.” Những hoạt động nào? Những người nào? Cuộc tranh luận vẫn tiếp diễn. Một số nhà nghiên cứu định nghĩa AGI là việc đạt được sự đa năng nhận thức của một người trưởng thành có giáo dục tốt; những người khác so sánh hiệu suất AI với một mẫu đại diện của người lớn.
Thêm vào sự nhầm lẫn, AGI thường bị lẫn lộn trong công luận với trí tuệ siêu cấp (ASI) – một AI thông minh hơn tất cả con người cộng lại. Hầu hết các nhà nghiên cứu AI coi AGI và ASI là hai cột mốc riêng biệt, nhưng trong trí tưởng tượng đại chúng, hai khái niệm này thường bị trộn lẫn.
—

Bí mật: OpenAI ra mắt gói Pro 100 USD dành cho lập trình viên

AGI trong mục tiêu doanh nghiệp – và khẩu hiệu marketing

Nếu cuộc tranh luận học thuật về định nghĩa AGI đã diễn ra lâu và tinh vi, thì thế giới doanh nghiệp lại đưa ra những định nghĩa độc đáo hơn.

DeepMind là công ty đầu tiên biến “trí tuệ nhân tạo tổng quát” thành mục tiêu kinh doanh. Legg đã đặt cụm từ này lên bìa kế hoạch kinh doanh đầu tiên khi ông, Demis Hassabis và Mustafa Suleyman đồng sáng lập công ty vào năm 2010.
OpenAI cũng công khai “xây dựng AGI” là sứ mệnh rõ ràng. Nguyên tắc thành lập năm 2015 của họ khẳng định viện nghiên cứu “cống hiến để đảm bảo rằng trí tuệ nhân tạo tổng quát mang lại lợi ích cho toàn nhân loại.” Khi OpenAI thành lập đơn vị vì lợi nhuận ba năm sau, họ công bố một bản hiến chương định nghĩa AGI là “các hệ thống tự động cao mà vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế.” Như vậy, lần đầu tiên AGI được đo lường bằng các chỉ số tài chính thay vì chỉ dựa trên nhận thức.

Khi Microsoft đầu tư 1 tỷ USD vào đơn vị vì lợi nhuận của OpenAI vào năm 2019, thỏa thuận đã khiến Microsoft trở thành đối tác thương mại ưu tiên cho bất kỳ mô hình AI nào mà viện nghiên cứu phát triển (nhưng không bao gồm AGI). Quyết định việc AI đã đạt AGI sẽ do hội đồng phi lợi nhuận của OpenAI quyết định.
Theo báo cáo của The Information năm 2024, khi Microsoft đồng ý đầu tư thêm 10 tỷ USD vào OpenAI vào năm 2023, hợp đồng chứa một điều khoản định nghĩa AGI là công nghệ có thể tạo ra ít nhất 100 tỷ USD lợi nhuận. OpenAI hiện vẫn cách xa ngưỡng tài chính này; công ty báo cáo doanh thu khoảng 13 tỷ USD năm ngoái trong khi chi tiêu 8 tỷ USD tiền mặt, và dự kiến sẽ không hòa vốn cho tới năm 2030.
Mặc dù còn xa ngưỡng tài chính, CEO OpenAI Sam Altman thường xuyên khẳng định công ty đang tiến gần tới cột mốc AI được đo bằng các tiêu chuẩn khác. Trong một bài blog tháng 1 2025 mang tên “Reflections,” Altman viết rằng OpenAI “hiện đã tự tin rằng chúng tôi biết cách xây dựng AGI như chúng tôi hiểu truyền thống.” Trong một tiểu luận sau đó, ông nói các hệ thống hướng tới AGI đang “lộ diện.” Tuy nhiên, ở những lúc khác Altman cũng thừa nhận “AGI đã trở thành một thuật ngữ rất lỏng lẻo.”
Microsoft cũng tận dụng sức lan tỏa của AGI trong marketing. Vào tháng 3 2023, một nhóm nhà nghiên cứu Microsoft công bố một bài báo 154 trang về GPT‑4 mang tiêu đề “Sparks of Artificial General Intelligence,” cho rằng mô hình này có thể xem là một phiên bản sớm (dù chưa hoàn chỉnh) của AGI. Bài báo bị chỉ trích rộng rãi vì thổi phồng khả năng của GPT‑4 vì mục đích thương mại; Altman sau đó đã tách rời, gọi GPT‑4 “vẫn còn sai, vẫn còn hạn chế.”
Các nghiên cứu và bộ chuẩn mới từ Google DeepMind và nhóm Hendrycks‑Bengio đã có một bước tiến nhất định trong việc thiết lập thước đo cho AGI, dựa trên hàng thập kỷ nghiên cứu trí thông minh con người. Điều rõ ràng là các mô hình AI hiện tại vẫn chưa sánh được với độ rộng và sâu của khả năng nhận thức con người.
—

Bí mật: Tìm kiếm AI và Vấn đề về Độ Tin Cậy

Bước ngoặt của Jensen

Huang, CEO của Nvidia, biết rõ điều này và có lẽ đã dự đoán trước cơn sốt trên mạng xã hội mà tuyên bố AGI của ông sẽ gây ra. Sau khi nói “AGI đã đạt được” trong cùng một podcast, ông tiếp tục nhấn mạnh rằng các đại lý AI OpenClaw – được hỗ trợ bởi các mô hình hàng đầu của các công ty như Anthropic và OpenAI – không bao giờ có thể sao chép Nvidia. “Bây giờ, khả năng 100.000 đại lý đó tự xây dựng Nvidia là 0 %,” ông nói.
Huang không chỉ là CEO của Nvidia; ông còn là người sáng lập và đã dẫn dắt công ty suốt 33 năm, đưa công ty thoát khỏi ngưỡng phá sản và đạt định giá hơn 4 nghìn tỷ USD. Ở nhiều khía cạnh, Huang là một thiên tài độc đáo – nhưng đồng thời cũng rất con người. Có lẽ chúng ta cần một định nghĩa mới, không phải AGI mà là AJI – artificial Jensen intelligence. Khi AI đạt tới mức độ đó, những người thúc đẩy trên mạng xã hội, thở hổn hển khi nâng cao tuyên bố AGI của Huang, cuối cùng sẽ có một điều đáng mừng thực sự.
Tags: AGI, Cognitive Taxonomy, Artificial General Intelligence