Các mô hình ngôn ngữ lớn (LLM) kém trong việc chơi cờ vua

Các mô hình ngôn ngữ lớn (LLM) chơi cờ vua không tốt.

Mặc dù vậy, với tư cách là một người vô địch cờ vua quốc gia ba lần và vô địch cờ vua nữ Hoa Kỳ hai lần, tôi vẫn thích chơi với chúng. Không phải vì chúng khiến tôi phải thi đấu hết sức, mà là vì chúng bật mí cho tôi những điều sâu sắc về bản chất con người.

Việc chơi cờ với LLM đã dạy tôi con người thật sự độc đáo và đa dạng như thế nào, con người dễ bị tâng bốc và nịnh nọt ra sao, và AI đang bắt đầu định hình hành vi của chúng ta như thế nào.

LLM không được tạo ra để chơi cờ vua giỏi. Rốt cuộc, chúng được thiết kế để dự đoán những gì có khả năng xảy ra tiếp theo và để tâng bốc chúng ta flatter us. Các thuật toán cờ vua được hỗ trợ bởi AI không có mục tiêu “đánh bại” người chơi; chúng muốn giữ cho người chơi tiếp tục chơi. Nhưng trong cách chơi cờ “kém” một cách thú vị này, chúng ta có thể rút ra những bài học vượt ra ngoài bàn cờ hay token.

Các chương trình AI cờ vua siêu nhân – từ máy đã đánh bại Garry Kasparov 30 năm trước cho tới AlphaZero của DeepMind ở đây – luôn có thể thắng bất kỳ người chơi nào. Hầu hết con người không còn đối đầu với những máy tính cờ vua hàng đầu nữa, bởi vì thất bại là điều chắc chắn. Việc liên tục bị đánh bại chỉ dạy bạn được chừng ấy thôi. Ngược lại, thử nghiệm với LLM lại mang lại cảm giác hưng phấn.

Khi tôi lần đầu thách thức ChatGPT‑4 chơi một ván cờ, nó chơi khá ổn, nhưng tôi vẫn có được vị trí tốt sau 15 nước và thắng được một quân mã. Khi lợi thế của tôi đang tăng lên, nó lại “ảo giác” một quân cờ ma để bắt lại hậu của tôi. Nói cách khác, nó gian lận! Ban đầu tôi không hiểu sao. Các mô hình LLM phổ biến không phải nổi tiếng vì nịnh nọt sao mà lại “gian lận” vậy?

Bí mật: Toàn Vẹn Nhân Tạo: Ranh Giới Mới

Vì vậy tôi quyết định chơi những nước tệ nhất mình có thể nghĩ ra chống lại ChatGPT. Nó lại “bẻ gãy” quy tắc, nhưng lần này có lợi cho tôi. Các quân ma xuất hiện thay cho những quân tôi đã làm mất. Dù tôi chơi tốt hơn hay tệ hơn ChatGPT, cuối cùng nó vẫn đưa tôi tới cùng một mức độ với nó. Nó không phải lúc nào cũng gian lận, nhưng luôn bịa chuyện. Khi con người bịa chuyện, chúng ta cố gắng lấp đầy những khoảng trống trong ký ức hoặc giấc mơ bằng chuỗi logic hợp lý nhất. ChatGPT cũng đang làm điều tương tự.

Tôi nhận thấy các ảo giác của LLM thường xuất hiện khi cố gắng thực hiện “nước đi xa”, tức là những nước di chuyển qua toàn bộ bàn cờ. Điều này phản ánh việc LLM gặp khó khăn trong các cuộc hội thoại dài.

Khi Google tổ chức giải đấu LLM hàng đầu, 42 trong số 47 ván đều mở bằng Sicilian Defense, một khai cuộc mà Bobby Fischer và nhân vật hư cấu Beth Harmon trong The Queen’s Gambit cũng ưa thích. Tại sao lại có quá nhiều sự ưa thích với Sicilian? Vì nó là khai cuộc phổ biến nhất. Nghiên cứu gần đây của DeepMind đây cho thấy cùng một hiện tượng khi họ cố gắng tạo ra những thế cờ đẹp, sáng tạo và phi truyền thống. Các nhà nghiên cứu phát hiện AI thường “tự lặp lại”, rơi vào vòng lặp với các chủ đề và mẫu mà chúng coi là “đẹp”.

Trong chương trình “đẹp” của DeepMind, các nhà nghiên cứu đã giảm thiểu hiện tượng này bằng cách lập trình rõ ràng để tăng tính đa dạng. Tuy nhiên, ngay cả khi có dữ liệu huấn luyện khổng lồ, đầu ra xác suất và bộ lọc đa dạng, việc mô phỏng được sự đa dạng và phạm vi suy nghĩ của con người vẫn không hề dễ dàng.

Không chỉ LLM và AI nói chung gặp khó khăn trong việc nắm bắt đa dạng trải nghiệm con người. Hãy nhìn vào động lực “người thắng lấy tất cả” của các nền tảng mạng xã hội, nơi việc tuân theo sở thích trung bình của người dùng mang lại nhiều lượt click, sự chú ý và tiền bạc hơn. Để tránh rơi vào tiếng nói đơn điệu và nền văn hoá đơn nhất, chúng ta phải tìm kiếm sự đa dạng trong nguồn thông tin, các prompt và dữ liệu đầu vào. Như Haruki Murakami đã viết: “Nếu bạn chỉ đọc những cuốn sách mà mọi người khác đang đọc, bạn chỉ có thể nghĩ những gì mọi người khác đang nghĩ.”

Bí mật: Các Quyết Định Hằng Ngày Có Nhiều "Nhiễu" Hơn Bạn Nghĩ — Đây Là Cách AI Có Thể Giúp Giảm Thiểu

Giống như các engine cờ, LLM sẽ ngày một tốt hơn, và chúng ta phải chuẩn bị cho tương lai đó. Cờ vua đã vật lộn với việc giữ trò chơi công bằng dù có AI siêu nhân trong nhiều thập kỷ. Thiết bị điện tử từ lâu đã bị cấm trong các giải đấu, nhưng điều đó không ngăn được việc gian lận gây chấn động làng cờ.

Trong một trong những bê bối gian lận cờ vua nổi tiếng nhất, Magnus Carlsen – người đứng đầu thế giới – thua trước Grandmaster 19 tuổi Hans Niemann vào năm 2022. Carlsen rời giải và sau đó được tiết lộ rằng Hans đã từng gian lận trong các trận đấu trực tuyến. Dù không có bằng chứng nào cho thấy Hans đã gian lận với Magnus, nhưng các thuyết âm mưu kỳ lạ lại lan truyền mạnh mẽ, thậm chí có một tin cho rằng chuỗi hạt hậu môn được dùng để truyền nước đi qua AI. Kể từ đó, các buổi phát sóng trực tiếp đã bổ sung độ trễ thời gian và tăng cường giám sát. Mặc dù có những biện pháp này, các cáo buộc và bê bối gian lận vẫn thường xuyên xuất hiện. Một số là hợp lý, những trường hợp khác thì thiếu chứng cứ, được thổi phồng bởi các thuật toán mạng xã hội thèm “kịch tính” và nỗi lo ngại về gian lận dựa trên AI.

Điều này dạy chúng ta rằng việc xây dựng các công cụ phát hiện gian lận tinh vi hơn sẽ không đủ trong tương lai do AI chi phối. Thay vào đó, chúng ta cần xây dựng niềm tin và tính trung thực trong cộng đồng. Đó là điều AI không thể thực hiện thay chúng ta.

Nó cũng nhắc nhở chúng ta không nên ngây thơ trước những phức tạp của tương lai AI. Thay vì sợ hãi, chúng ta cần tìm cách khai thác AI một cách tích cực.

Bí mật: Lộ trình phát triển toàn diện cho AI Product Manager

Các kỳ thủ cờ đã trở thành chuyên gia trong việc cân bằng việc sử dụng AI để luyện tập và chuẩn bị, bằng cách xem lại ván đấu của mình và của đối thủ. “Vị trí an toàn” là mở rộng và tinh chỉnh danh sách các nước có thể, nhưng không để nó chiếm hết suy nghĩ của mình. Tôi thích “phương pháp sandwich”: bắt đầu với trí não của mình (lòng bánh), sau đó xem AI nói gì về tình huống (lớp nhân), cuối cùng quay lại suy ngẫm bằng trí não của mình.

LLM có hai mặt. Chúng có thể làm chúng ta trở nên sắc bén và thông minh hơn. Hoặc chúng khiến chúng ta trở nên mờ nhạt và trung bình, chỉ có thể suy nghĩ khi có máy tính bên cạnh. Khi chơi cờ với LLM, chúng ta có thể nhìn rõ hơn những điểm mạnh và hạn chế của chúng như một huấn luyện viên hoặc người đồng hành, từ đó biết khi nào nên nói: “Chúc ngủ ngon, Gemini.”

Tags: LLM Chess, AI Ethics, Chess Strategy