Các Quyết Định Hằng Ngày Có Nhiều “Nhiễu” Hơn Bạn Nghĩ — Đây Là Cách AI Có Thể Giúp Giảm Thiểu

Từ phí bảo hiểm đến phòng xử án: sức ảnh hưởng của “nhiễu”

Gần đây, tôi vừa đọc xong cuốn sách Noise: A Flaw in Human Judgment – tác phẩm đáng suy ngẫm của Daniel Kahneman (người từng đoạt giải Nobel Kinh tế, cũng là tác giả của Thinking Fast and Slow), cùng hai giáo sư Olivier Sibony và Cass Sunstein. Cuốn sách chỉ rõ sự tồn tại thường xuyên nhưng âm thầm của “nhiễu” trong các hoạt động ra quyết định của con người – được hiểu là sự khác biệt trong kết quả đánh giá cùng một vấn đề giữa các chuyên gia trong một lĩnh vực. Sách đưa ra nhiều ví dụ thực tế cho thấy ảnh hưởng của nhiễu trong các lĩnh vực như bảo hiểm, y tế, pháp lý, khoa học hình sự.

“Nhiễu” khác với thiên lệch (bias) – tức là xu hướng các kết quả bị lệch về một hướng nhất định trong nhóm chuyên gia. Điểm khác biệt này được thể hiện rõ qua hình minh họa dưới đây:

Hình 1. Bốn nhóm minh họa thiên lệch và nhiễu trong đánh giá. Tâm bia là đáp án đúng. Thiên lệch xuất hiện khi các mũi tên đều lệch khỏi tâm bia về cùng một hướng (nhóm A, B). Nhiễu thể hiện qua việc các mũi tên phân tán, không tập trung (nhóm A, C, D). Nhóm A vừa có thiên lệch cao, vừa có nhiễu lớn. 📖 Nguồn: Daniel Kahneman, Olivier Sibony, Cass R. Sunstein, Noise: A Flaw in Human Judgment (HarperCollins, 2021). Hình do tác giả chỉnh sửa.

Hình trên giúp phân biệt rõ thiên lệch và nhiễu trong đánh giá của con người. Mỗi nhóm là một tập hợp kết quả đánh giá lặp lại trên cùng một vấn đề, tâm bia tượng trưng cho đáp án chính xác. Nếu các mũi tên đều lệch về một phía, đó là thiên lệch; nếu các mũi tên rải rác, thiếu nhất quán, đó là nhiễu.

Tóm tắt:

Nhóm A: Các mũi tên vừa lệch khỏi tâm bia, vừa phân tán – có cả thiên lệch lẫn nhiễu.
Nhóm B: Mũi tên tập trung nhưng lệch khỏi tâm bia – thiên lệch rõ rệt, nhiễu thấp.
Nhóm C: Mũi tên rải rác quanh tâm bia – nhiễu cao, thiên lệch thấp.
Nhóm D: Cũng phân tán, biểu hiện nhiễu.

> Thiên lệch làm cho quyết định sai lệch theo một chiều, còn nhiễu khiến kết quả thất thường, làm giảm tính công bằng và đáng tin cậy.

Với những ai làm trong lĩnh vực Trí tuệ nhân tạo (AI), sẽ dễ liên tưởng thiên lệch và nhiễu đến khái niệm bias-variance tradeoff trong AI, nơi chúng ta muốn mô hình vừa giải thích tốt dữ liệu, vừa tránh bị quá lệch hoặc quá biến động. Trong trường hợp này, nhiễu tương đương với phương sai.

Sai số trong các đánh giá của con người gồm hai phần chính, có thể mô tả bằng công thức sai số tổng thể (MSE):

> Sai số tổng thể (MSE) = Thiên lệch² + Nhiễu²

Thiên lệch là mức sai lệch trung bình, còn nhiễu là mức độ phân tán (độ lệch chuẩn) giữa các đánh giá. Để giảm sai số tổng thể, cần xử lý cả hai yếu tố này. Thiên lệch thường dễ nhận ra hơn – thể hiện rõ khi kết quả liên tục nghiêng về một phía. Nhiễu lại khó phát hiện hơn, vì nó nằm trong sự dao động tự nhiên của các đánh giá. Hình dung lại tâm bia: thiên lệch là khi tất cả mũi tên chụm về một chỗ nhưng không trúng tâm, nhiễu là khi mũi tên bắn khắp nơi. Cả hai đều làm giảm độ chính xác, nhưng theo cách khác nhau. Thực tế cho thấy, cần giảm cả thiên lệch lẫn nhiễu, không nên chỉ chú ý đến một phía. Khi nhiễu giảm, thiên lệch tiềm ẩn cũng dễ nhận diện hơn.

Để minh họa thêm về thiên lệch và nhiễu, dưới đây là một sơ đồ khác từ sách. Trục x là mức độ sai số (độ lệch giữa kết quả và thực tế), trục y là xác suất. Biểu đồ trái: nhiễu giảm, thiên lệch giữ nguyên – kết quả phân bố hẹp lại nhưng vẫn lệch khỏi số 0. Biểu đồ phải: thiên lệch giảm, phân bố dịch gần về 0, nhưng mức độ phân tán (nhiễu) không đổi.

Hình 2: Giảm nhiễu giúp thu hẹp phạm vi sai số; giảm thiên lệch giúp giá trị trung bình tiến gần đúng thực tế. 📖Nguồn: Daniel Kahneman, Olivier Sibony, Cass R. Sunstein, Noise: A Flaw in Human Judgment (HarperCollins, 2021). Hình do tác giả chỉnh sửa.

Nhiễu và thiên lệch lý giải vì sao các tổ chức thường ra quyết định vừa thiếu chính xác, vừa không nhất quán, chịu ảnh hưởng từ yếu tố như tâm trạng, thời gian, hay hoàn cảnh. Ví dụ điển hình là các phán quyết của tòa án: hai thẩm phán, hoặc cùng một thẩm phán vào những ngày khác nhau, có thể xử lý tương tự nhưng lại ra quyết định rất khác nhau. Những yếu tố bên ngoài tưởng chừng vụn vặt như thời tiết hay kết quả trận đấu bóng đá địa phương cũng có thể tác động đến phán quyết. Để khắc phục, hiện nay các startup như Bench IQ đang ứng dụng AI để nhận diện và giảm thiểu nhiễu, thiên lệch trong các quyết định pháp lý. Họ phát triển công cụ tổng hợp hành vi của thẩm phán, giúp luật sư dự báo chính xác hơn hướng phán quyết. Những công cụ này nhằm giải quyết vấn đề lớn mà Noise đề cập: khi sự ngẫu nhiên làm sai lệch những quyết định quan trọng, thì việc đo lường và dự báo mẫu đánh giá sẽ giúp tăng tính nhất quán.

Một ví dụ thuyết phục khác trong sách là ngành bảo hiểm. Các tác giả chỉ ra rằng đánh giá của các chuyên viên thẩm định có sự chênh lệch rất lớn. Kiểm toán cho thấy mức báo giá phụ thuộc nhiều vào từng người thực hiện – gần như một trò may rủi. Trung bình, chênh lệch giữa hai chuyên viên lên tới 55% giá trị trung bình, cao gấp năm lần so với dự đoán của các giám đốc. Cùng một trường hợp, người này báo phí bảo hiểm $9,500, người khác lại tới $16,700 – một sự khác biệt quá lớn. Như vậy, nhiễu là vấn đề thực tế, không phải lý thuyết xa vời.

> Hãy thử tự hỏi: nếu phải dựa vào đánh giá chuyên môn, bạn có muốn kết quả giống như chơi xổ số không, hay mong muốn một hệ thống cho ra kết quả ổn định, nhất quán?

Rõ ràng, nhiễu là một hiện tượng có thật và gây tổn thất lớn cho tổ chức – từ sai lầm, kém hiệu quả, đến việc mất cơ hội vì quyết định thiếu chính xác.

Vì Sao Quyết Định Nhóm Thường Có Nhiễu Lớn: Hiệu Ứng Dây Chuyền Thông Tin & Cực Đoan Nhóm

Khái niệm trí tuệ tập thể cho rằng quyết định của nhiều người, nếu độc lập, sẽ tiệm cận sự thật – các sai số cá nhân sẽ triệt tiêu lẫn nhau. Francis Galton đã minh chứng điều này từ năm 1906, khi ông tổ chức một cuộc thi đoán trọng lượng bò với 800 người. Từng cá nhân đoán rất khác nhau, nhưng trung bình cộng của cả nhóm lại gần như chính xác tuyệt đối, chỉ lệch một pound. Đây là sức mạnh của tổng hợp: sai số cá nhân bị triệt tiêu, kết quả chung gần với thực tế.

Tuy nhiên, trong thực tế, yếu tố tâm lý – xã hội lại làm quá trình này bị méo mó. Trong nhóm, kết quả còn phụ thuộc ai phát biểu trước, ai ngồi cạnh ai, hoặc ai chủ động nêu ý kiến. Cùng một nhóm, cùng một vấn đề, nhưng có thể ra kết quả rất khác nhau vào các thời điểm khác nhau.

Sách Noise: A Flaw in Human Judgment lấy ví dụ về việc bình chọn bài hát để minh họa: khi mọi người thấy một bài hát được nhiều người tải, họ cũng có xu hướng tải theo, tạo hiệu ứng lan truyền. Đáng chú ý, cùng một bài hát lại có thể thành công hoặc thất bại ở các nhóm khác nhau, chủ yếu do tác động ban đầu. Nghiên cứu cho thấy, ảnh hưởng xã hội có thể làm nhiễu quyết định tập thể, đôi khi khuếch đại biến động một cách khó kiểm soát.

Có hai cơ chế chính giải thích động lực của quyết định nhóm:

Hiệu ứng dây chuyền thông tin (Information Cascades): Như hiệu ứng domino, một tín hiệu ban đầu nhỏ có thể dẫn cả nhóm đi lệch hướng. Mọi người dễ dàng làm theo ý kiến vừa được nêu ra, thay vì tự đưa ra đánh giá thật của mình. Áp lực xã hội càng làm hiệu ứng này mạnh hơn – ít ai muốn mình trở thành người “lạc loài”.
Cực đoan nhóm (Group Polarization): Thảo luận nhóm thường làm ý kiến bị đẩy về phía cực đoan hơn. Thay vì cân bằng, tranh luận lại khiến nhóm có xu hướng khoan dung hoặc nghiêm khắc hơn so với trung bình. Kahneman và đồng tác giả minh họa với bồi thẩm đoàn: nếu các thành viên đánh giá độc lập, nhiễu ít hơn hẳn so với khi cùng thảo luận, lúc đó ý kiến thường bị kéo về phía cực đoan.

Thật bất ngờ, thảo luận tập thể đôi khi lại khiến kết quả kém chính xác và nhiều biến động hơn so với khi từng người đánh giá độc lập. Đây là bài học quan trọng dành cho nhà quản lý: nên tổ chức thảo luận nhóm sao cho chú ý giảm cả thiên lệch lẫn nhiễu.

Vẽ Bức Tranh Các Quyết Định Mang Nhiễu

Bài học quan trọng từ Noise: A Flaw in Human Judgment là: mọi quyết định của con người, dù cá nhân hay tập thể, đều có yếu tố nhiễu. Nếu bạn từng gặp phải sự biến động trong đánh giá chuyên môn, chắc hẳn sẽ dễ nhận ra điều này. Bằng chứng rất rõ: ngành y, pháp luật, dự báo, quyết định tị nạn, đánh giá nhân sự, xử lý bảo lãnh, thậm chí cả khoa học hình sự và xét duyệt bằng sáng chế – đều có nhiễu. Nhiễu xuất hiện khắp nơi nhưng thường bị bỏ qua, ít được giải quyết triệt để.

Để hiểu rõ hơn về nhiễu, có thể chia các loại quyết định ra thành các nhóm. Hai tiêu chí quan trọng giúp phân loại:

Quyết định lặp lại vs đơn lẻ: Quyết định lặp lại là những quyết định xử lý nhiều trường hợp tương tự – như thẩm định bảo hiểm, tuyển dụng, chẩn đoán bệnh. Lúc này, nhiễu dễ nhận thấy vì sự không nhất quán giữa các chuyên gia. Quyết định đơn lẻ – ví dụ cấp bằng sáng chế, duyệt bảo lãnh, xét trường hợp tị nạn – là những quyết định chỉ thực hiện một lần, khó so sánh nên nhiễu tồn tại nhưng khó phát hiện.
Đánh giá vs dự báo: Quyết định đánh giá là nhận định về chất lượng hoặc giá trị – như xếp hạng ứng viên, đánh giá bài nghiên cứu, nhận xét hiệu quả làm việc. Quyết định dự báo là dự đoán kết quả tương lai – như khả năng tái phạm, đáp ứng điều trị, hoặc tiềm năng thành công của startup. Cả hai loại đều chịu ảnh hưởng của nhiễu, nhưng cơ chế khác nhau: nhiễu trong đánh giá thường do tiêu chí không nhất quán, nhiễu trong dự báo xuất phát từ việc mỗi người hình dung, cân nhắc tương lai theo cách riêng.

Kết hợp lại, các loại này tạo thành khung tư duy giúp hiểu bản chất của nhiễu trong đánh giá con người. Nhiễu ảnh hưởng cả cách ta đánh giá lẫn dự báo. Nhận biết rõ sự khác biệt này là bước đầu để xây dựng hệ thống giúp giảm biến động, tăng chất lượng quyết định. Phần sau sẽ trình bày các giải pháp cụ thể nhằm giảm nhiễu cho từng loại đánh giá.

Không Phải Mọi Nhiễu Đều Giống Nhau: Phân Biệt Các Dạng Nhiễu

Đối với các quyết định lặp lại, kiểm toán nhiễu có thể giúp nhận diện mức độ không nhất quán trong đánh giá con người. Nhà quản lý có thể tổ chức cho nhiều người đánh giá cùng một trường hợp, từ đó phát hiện và đo lường sự khác biệt trong kết quả. Kết quả kiểm toán đôi khi rất bất ngờ, ví dụ như trường hợp thẩm định bảo hiểm ở trên.

Các tác giả Noise: A Flaw in Human Judgment chia nhiễu thành các loại:

Nhiễu mức độ (Level Noise): Bạn khác đồng nghiệp ở mức nào? Đây là sự khác biệt về mức đánh giá trung bình giữa các cá nhân – ví dụ, thẩm phán nghiêm khắc hơn, thẩm định viên dễ tính hơn.
Nhiễu kiểu mẫu (Pattern Noise): Bạn thường sai theo một cách nào? Đây là xu hướng cá nhân khiến quyết định của một người bị lệch – ví dụ, luôn nhẹ tay với một số trường hợp, luôn bi quan hoặc nghiêm khắc với kiểu hồ sơ nhất định. Nhiễu kiểu mẫu gồm hai phần: kiểu mẫu ổn định (xu hướng cá nhân lặp lại theo thời gian), và kiểu mẫu tạm thời (phát sinh do tâm trạng, mệt mỏi, hoàn cảnh nhất thời).
Nhiễu ngẫu nhiên (Occasion Noise): Một người có thể tự mâu thuẫn với chính mình như thế nào? Đây là sự biến động trong đánh giá của một cá nhân ở các thời điểm khác nhau, do ảnh hưởng bởi trạng thái tâm lý, hoàn cảnh, hoặc các yếu tố bên ngoài.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top