Phần 2 – Chương 17: Sự hồi quy về mức trung bình

Trong suốt sự nghiệp nghiên cứu của mình, tôi cảm thấy hài lòng nhất với một trong những thực nghiệm mà tôi đã tiến hành trong quãng thời gian tôi dạy bộ môn Tâm lý học cho không lực của Israel. Mục đích của môn học nhằm đào tạo cho các chỉ huy phi đội cải thiện khả năng gây ảnh hưởng của mình đến các sĩ quan trong phi đội của không lực Israel. Tôi đã giảng về nguyên tắc quan trọng của kỹ năng đào tạo trong việc áp dụng phần thưởng dành cho hiệu quả công việc, tốt hơn là việc áp dụng hình phạt dành cho công việc kém hiệu quả. Nguyên tắc này được kiểm chứng bởi rất nhiều bằng chứng thuyết phục từ các nghiên cứu về chim bồ câu, chuột, một số loài động vật khác và con người.

Khi tôi kết thúc bài giảng tâm huyết của mình, một trong những viên chỉ huy dày dạn kinh nghiệm nhất của không lực Israel đã giơ tay và trình bày một bài diễn thuyết ngắn của mình. Anh ta thừa nhận rằng việc áp dụng phần thưởng dành cho thành tích tiến bộ có thể là tốt với lũ chim nhưng anh ta cũng phủ nhận rằng phương pháp này không phù hợp để áp dụng đối với các sĩ quan không quân dự bị. Đây là những gì anh ta đã phát biểu: “Trong rất nhiều dịp, tôi đã từng tán dương các sĩ quan không quân dự bị bởi họ đã hoàn thành một số động tác nhào lộn trên không. Và những lần tiếp sau đó mặc dù họ cũng thực hiện cùng động tác nhào lộn trên không ấy nhưng họ lại làm tệ hơn lần trước. Mặt khác, tôi thường gào vào tai nghe của học viên khi họ thực hiện động tác nhào lộn trên không đó không tốt và tôi nhận thấy nhìn chung họ đã làm tốt hơn trong lần thử kế tiếp. Bởi vậy, làm ơn đừng nói với chúng tôi rằng việc sử dụng phần thưởng thì tốt còn việc sử dụng hình phạt thì không tốt, bởi sự mâu thuẫn này thực sự đã xảy ra trong chính tình huống mà tôi đang ví dụ.”

Đó quả là một khoảnh khắc vui sướng tuyệt vời. Khi nghe những gì anh ta nói, tôi thực sự cảm thấy mình đã hiểu thông suốt một nguyên tắc thống kê mà tôi đã từng giảng dạy trong nhiều năm nay. Vị chỉ huy nọ nói đúng nhưng anh ta không thực sự hiểu bản chất của vấn đề. Sự quan sát của anh ta rất tinh tế và chính xác. Đúng là những dịp mà anh ta khích lệ thành tích tốt của các sĩ quan đó, có thể là diễn ra sau một thành tích không tốt của các sĩ quan này trước đó và những lần anh ta quở trách thành tích không tốt của các sĩ quan này được tiếp nối bởi một sự tiến bộ khác thường của chính các sĩ quan này. Nhưng kết luận mà anh ta đã rút ra về tính khả thi của việc áp dụng thưởng phạt hoàn toàn không phù hợp trong tình huống này. Thứ mà anh đã từng quan sát được, chúng được gọi là sự hồi quy về mức trung bình, thứ xảy ra trong tình huống này là do những dao động ngẫu nhiên trong thứ hạng thành tích quyết định. Cố nhiên, anh ta đã tán dương khi một sĩ quan dự bị có thành tích vượt trội hơn so với mức trung bình của thành tích mà anh ta có thể đạt được. Nhưng sĩ quan dự bị nọ chắc hẳn chỉ là ăn may với sự nỗ lực trong một tình huống cụ thể và bởi vậy rất có thể đó là nguyên nhân (sự may mắn này không xuất hiện nữa) làm giảm thành tích ở những lần khác bất chấp việc anh sĩ quan này có được tán dương hay không. Tương tự như vậy, vị chỉ huy đã có thể hét toáng vào tai nghe của sĩ quan dự bị khi thành tích của người này tệ bất thường và bởi vậy rất có khả năng anh sĩ quan này sẽ tiến bộ trong những lần thực hiện tiếp theo bất chấp việc người chỉ huy có làm gì anh sĩ quan này hay không. Vị chỉ huy đã gán một sự diễn giải kiểu nhân quả với những dao động thường thấy ở một tiến trình ngẫu nhiên trong một tình huống cụ thể để chứng minh cho việc anh ta thấy việc áp dụng hình thức thưởng phạt không phù hợp trong việc huấn luyện sĩ quan dự bị.

Sự thách thức đã kêu gọi một phản ứng, nhưng một bài học đại số về dự đoán sẽ không có đáp án theo cách đơn giản thế (theo quy luật nhân quả) mà anh chỉ huy này gán cho. Thay vào đó, để giúp các học viên này hiểu nguyên tắc mà tôi đang giảng dạy bằng việc đưa ra một ví dụ, trong ví dụ này, tôi đã sử dụng một mẩu phấn để đánh dấu một vạch đích trên nền nhà. Tôi đã yêu cầu mỗi viên chức trong phòng xoay lưng lại vạch đích và tung hai đồng xu về hướng vạch đích liên tiếp mà không nhìn. Tôi đã đo lường các khoảng cách từ vạch đích và viết hai kết quả của từng người tham gia lên một tấm bảng. Sau đó tôi viết lại các kết quả theo trình tự, từ thành tích tốt nhất cho tới thành tích tệ nhất trong lần thử thứ nhất. Có vẻ như là hầu hết (nhưng không phải là tất cả) những ai đã thực hiện tốt nhất lần thứ nhất đều có thành tích kém đi trong lần thử thứ hai của mình và những ai có thành tích tồi tệ trong lần thực hiện thứ nhất thường lại tiến bộ vào lần thử kế tiếp. Tôi đã chỉ ra cho các chỉ huy thấy rằng thứ họ nhìn được trên bảng đã trùng với thứ mà tôi thấy về thành tích của các cuộc diễn tập nhào lộn trên không trong ví dụ của vị chỉ huy trên. Đó là với những cố gắng liên tiếp, thì thành tích kém về cơ bản được nối tiếp bởi thành tích tiến bộ và thành tích tốt được nối tiếp bởi thành tích sa sút, mà không hề có bất cứ sự trợ giúp nào hoặc bất kỳ lời tán dương hay lời quở trách nào.

Phát hiện mà tôi có được vào ngày hôm đó chính là những gì vị sĩ quan chỉ huy không quân đã hiểu nhầm trong một sự ngẫu nhiên đáng tiếc ở ví dụ trên. Bởi họ đã quở trách những sĩ quan dự bị khi thành tích của các sĩ quan này kém, phần lớn họ đã được thưởng bởi một thành tích tiến bộ sau đó, dù cho sự quở trách thực sự không hẳn là nguyên nhân dẫn đến sự tiến bộ của họ. Hơn thế nữa, các vị chỉ huy cũng không phải là người duy nhất hiểu nhầm như vậy. Tôi đã từng đối mặt với một sự hiểu nhầm đáng tiếc như thế, khi tôi nghiên cứu về trạng thái của con người, về sự phản hồi mà qua đó cuộc sống phơi bày cho chúng ta một sự thật, thật trớ trêu. Bởi vì chúng ta thường có xu hướng tử tế với người khác khi họ làm vừa lòng chúng ta và cáu bẳn khi họ làm điều ngược lại, nhưng sự thật lại rất phũ phàng. Qua số liệu thống kê mà tôi đã làm trong thực nghiệm lại cho thấy chúng ta bị trừng phạt bởi hành động tử tế và lại được đền ơn bởi hành động cáu bẳn.

TÀI NĂNG VÀ MAY MẮN

Một vài năm trước, John Brockman là biên tập viên của trang báo mạng Edge, đã đề nghị một số nhà khoa học đưa ra “phương trình ưa thích” của họ. Dưới đây là những gợi ý của tôi:

Thành công = tài năng + may mắn.

Thành công rực rỡ = một chút ít tài năng + phần nhiều
may mắn.

Gợi ý này không hề gây bất ngờ rằng may mắn thường góp phần mang lại những kết quả đáng kinh ngạc, khi chúng tôi ứng dụng phương trình này vào hai ngày đầu của vòng thi đấu gôn ở trình độ cao. Để giúp cho dễ hiểu, tôi giả định rằng trong cả hai ngày này điểm số trung bình của các đấu thủ dừng ở 72 gậy chuẩn. Chúng tôi tập trung vào một tay gôn đã thi đấu rất tốt trong ngày đầu tiên, kết thúc với một điểm số là 66. Chúng ta có thể rút ra được gì từ điểm số xuất sắc này? Một kết luận tức thì, đó là tay gôn này tài năng hơn hẳn tài năng trung bình của các đối thủ trong vòng thi đấu. Công thức cho sự thành công đưa ra một kết luận khác được giải thích tương tự là tay gôn chơi tốt ở ngày thứ nhất chắc hẳn đã may mắn nhiều hơn đại đa số các tay gôn khác vào ngày thi đấu đó. Nếu bạn thừa nhận rằng tài năng và may mắn cùng dự phần vào thành công, thì việc kết luận tay gôn thi đấu tốt nhất kia là may mắn thì cũng giống như việc kết luận anh ta là một tài năng.

Vì lẽ ấy, nếu bạn tập trung vào một tay gôn ghi điểm trên năm gậy chuẩn vào ngày hôm đó, bạn có lý do để kết luận rằng tay gôn ấy vừa chơi kém vừa có một ngày xui xẻo. Dĩ nhiên, bạn biết được rằng cả hai kết luận này đều không chắc chắn (không thể khẳng định kết luận nào sai, kết luận nào đúng). Ở ví dụ này, rất có thể là tay gôn đã ghi 77 gậy chuẩn thực sự rất tài năng nhưng cũng có một ngày xui xẻo khác thường. Dù rằng, những kết luận này không chắc chắn. Có lẽ, những kết luận sau đây từ điểm số của ngày thứ nhất là hợp lý và thường sẽ đúng nhiều hơn là sai.

Điểm số trên trung bình vào ngày thứ nhất = tài năng trên trung bình + may mắn vào ngày thứ nhất.

Và:

Điểm số dưới trung bình vào ngày thứ nhất = tài năng dưới trung bình + không may vào ngày thứ nhất.

Giờ thì giả sử bạn biết được điểm số của một tay gôn vào ngày thứ nhất và được yêu cầu dự đoán điểm số của anh ta vào ngày thứ hai. Bạn kỳ vọng tay gôn này vẫn tiếp tục giữ được phong độ như vậy trong ngày thứ hai, do vậy phán đoán tốt nhất của bạn sẽ là “trên mức trung bình” đối với tay gôn thứ nhất và “dưới mức trung bình” đối với tay gôn thứ hai. Dĩ nhiên, may mắn lại là một vấn đề khác mà ta phải bàn tới. Khi bạn không thể dự đoán được sự may mắn của các tay gôn vào ngày thứ hai (hay bất cứ ngày nào), dự đoán tốt nhất của bạn hẳn phải là “mức trung bình”, chứ không phải là “tốt” hay “xấu”. Điều này có nghĩa là trong tình trạng không có bất cứ thông tin nào khác thì dự đoán tốt nhất của bạn về điểm số của các tay gôn vào ngày thứ hai không nên lặp lại dự đoán thành thích của họ vào ngày thứ nhất. Dưới đây là điều tốt nhất bạn có thể nói:

  • Tay gôn đã thể hiện tốt vào ngày thứ nhất có khả năng sẽ thành công tương tự vào ngày thứ hai nhưng kém hơn ngày thứ nhất, bởi sự may mắn mà anh ta đã có trong ngày thứ nhất không chắc duy trì được đến ngày thứ hai.
  • Tay gôn mà đã thể hiện kém vào ngày thứ nhất sẽ chắn chắn ở mức dưới trung bình vào ngày hai nhưng sẽ có cải thiện hơn ngày thứ nhất, bởi vận đen của anh ta chắn hẳn không tiếp diễn đến ngày thứ hai.

Chúng ta cũng trông đợi khoảng cách giữa hai tay gôn được rút ngắn vào ngày thứ hai, mặc dù dự đoán tốt nhất của chúng ta đó là tay gôn thứ nhất sẽ vẫn thể hiện tốt hơn tay gôn thứ hai.

Các sinh viên của tôi luôn ngạc nhiên khi nghe rằng thành tích được dự đoán tốt nhất vào ngày thứ hai có thể phù hợp hơn, ở gần với mức trung bình hơn thứ chứng cứ thu thập được dựa vào điểm số của ngày thứ nhất. Đây chính là lý do tại sao mà hình mẫu này được gọi là “sự hồi quy về mức trung bình”. Điểm số ban đầu càng cao, sự hồi quy mà chúng ta mong đợi càng lớn, bởi một điểm số tốt ám chỉ một ngày cực kỳ may mắn. Sự dự đoán hồi quy là hợp lẽ nhưng độ chính xác của chúng cũng không được đảm bảo. Một vài tay gôn đã ghi được 66 điểm vào ngày thứ nhất thậm chí còn có thể chơi tốt hơn vào ngày thứ hai nếu như anh ta tận dụng được vận may. Nhưng hầu hết sẽ chơi tệ hơn, bởi vận may của họ chẳng mấy mà còn trên mức trung bình (vì theo phép tính về hồi quy thì nó sẽ có xu hướng đưa về mức trung bình).

Giờ chúng ta hãy cùng đi ngược lại chiều thời gian. Sắp xếp thứ tự các gôn thủ qua thành tích của họ trong ngày thứ hai và nhìn vào thành tích của họ ở ngày thứ nhất. Bạn sẽ phát hiện ra đúng hình mẫu tương tự của sự hồi quy về mức trung bình. Các gôn thủ chơi tốt hơn vào ngày thứ hai hẳn đã gặp may mắn trong ngày hôm đó và dự đoán chuẩn xác nhất đó là họ đã ít may mắn hơn và đã chơi ít hiệu quả hơn vào ngày thứ nhất. Sự thực là bạn quan sát thấy sự hồi quy khi bạn dự đoán một biến cố trước đó và từ một biến cố sau đó sẽ có thể giúp thuyết phục bạn rằng sự hồi quy không thể đưa ra được một sự lý giải nhân quả.

Hiệu ứng hồi quy có mặt ở khắp nơi và vì vậy chúng ta dễ bị nhầm lẫn với những câu chuyện nhân quả nhằm lý giải cho hiệu ứng hồi quy này. Một ví dụ được biết đến nhiều đó là “vận rủi Sports Illustrated”, với tuyên bố rằng một vận động viên có ảnh xuất hiện trên trang bìa của một tờ tạp chí bị cho là sẽ có thành tích tồi tệ trong mùa giải kế tiếp. Sự tự tin thái quá cộng với sự thúc ép của việc chạm tới những dự đoán cao dường như thường được giải thích cho hệ quả. Nhưng ở đây tồn tại một bản miêu tả đơn giản hơn về vận rủi: Một vận động viên có ảnh được chọn đăng trên trang bìa tạp chí Sports Illustrated hẳn đã thể hiện cực kỳ tốt trong mùa giải trước đó, hẳn nhiên cùng với sự giúp sức của “cú hích” đến từ vận may mà vận may lại vốn không tồn tại mãi mãi (nên yếu tố vận may này có thể giải thích cho việc anh ta bị thất bại ở mùa kế tiếp vì vận may không còn ở bên anh ta nữa).

Tôi đã tình cờ theo dõi môn trượt tuyết nam tại Thế vận hội Mùa đông trong khi tôi cùng Amos viết một bài báo về sự dự đoán trực giác. Mỗi một vận động viên có hai lượt trượt trong ngày thi đấu đó và các kết quả đã được cộng lại để lấy điểm số cuối cùng. Tôi đã giật mình khi nghe những lời bình phẩm từ tay bình luận viên trong khi các vận động viên đang chuẩn bị cho lượt trượt thứ hai của họ: “Đội Na Uy đã có một màn trình diễn ấn tượng, Vận động viên này hẳn đang căng thẳng, hy vọng anh ta có thể bảo vệ được vị trí dẫn đầu của mình và chắc hẳn anh ta sẽ thể hiện kém hơn lượt trượt thứ nhất” hoặc “Đội Thụy Điển đã có một màn biểu diễn tồi tệ đầu tiên và giờ đây vận động viên này biết được rằng mình chẳng còn gì để mất và có lẽ anh ta cảm thấy thoải mái. Cảm giác thoải mái này có thể sẽ giúp anh ta biểu diễn tốt hơn ở lượt trượt thứ hai tới.” Bình luận viên này rõ ràng đã nhận ra sự hồi quy về mức trung bình và đã hình dung ra một câu chuyện nhân quả mà chẳng hề có căn cứ nào cả. Câu chuyện ấy tự thân nó thậm chí đã có thể đúng. Có lẽ nếu chúng ta đo được mạch đập của từng vận động viên trước mỗi lượt trượt thì chúng ta đã có thể biết được liệu rằng họ thật sự có thoải mái hơn sau một lượt trượt tồi tệ không. Và có khi kết quả đo mạch lại không giống như dự đoán của tay bình luận viên. Điểm đáng ghi nhớ đó là sự thay đổi từ lượt trượt thứ nhất sang lượt thứ hai mà không cần tới một sự giải thích nhân quả. Đó là một kết quả chính xác không thể tránh khỏi của thực tế rằng may mắn đã chiếm một phần trong kết quả của lượt trượt đầu tiên. Chúng ta có thể đều thiên về một cách diễn giải nhân quả, đây không phải một câu chuyện vô cùng thỏa đáng nhưng đó lại là cách lý giải cho tất cả các câu chuyện mà chúng ta thường làm.

HIỂU VỀ SỰ HỒI QUY

Cho dù không được phát hiện hay được hiểu không đúng thì hiện tượng hồi quy vẫn xa lạ với trí não con người. Quả thực là quá xa lạ tới nỗi lần đầu tiên nó được nhìn nhận và hiểu đúng sau khi “học thuyết trọng lực” ra đời được 200 năm và phép tính vi phân ra đời. Hơn thế nữa, rất khó khăn để những bộ não vĩ đại nhất Vương quốc Anh thế kỷ XIX có thể tìm ra ý nghĩa của nó vì thực chất nó thực sự là một phép tính khó.

Sự hồi quy về mức trung bình đã được phát hiện và đặt tên vào cuối thế kỷ XIX bởi Sir Francis Galton, một người gần như là anh em họ với Charles Darwin và là một nhà bác học nổi tiếng. Bạn có thể cảm nhận được phát hiện quan trọng này trong một bài báo ông đã cho đăng vào năm 1886 với nhan đề “Sự hồi quy về giá trị trung bình trong vóc người di truyền” trong đó giải trình bằng các số đo của các thế hệ con cháu kế tiếp nhau và bằng những so sánh về chiều cao của trẻ em với chiều cao của cha mẹ chúng. Ông viết về những nghiên cứu của mình đối với các thế hệ con cháu như sau:

Họ đã tìm ra các kết quả thật đáng chú ý và tôi đã sử dụng chúng làm nền tảng cho một bài giảng trước Học viện Hoàng gia và ngày 9 tháng Hai, năm 1877. Điều này đã được hiển hiện từ những thực nghiệm mà thế hệ con cái đã không có xu hướng giống với những di truyền về tầm thước của cha mẹ, mà lại luôn có xu hướng thấp hơn so với cha mẹ của chúng và có xu hướng nhỏ nhắn hơn thế hệ cha mẹ, trong trường hợp cha mẹ chúng to lớn. Nhưng con cái lại có xu hướng to lớn hơn thế hệ cha mẹ chúng, trong trường hợp thế hệ cha mẹ chúng vô cùng nhỏ nhắn. Các thực nghiệm sâu hơn đã phát hiện thêm rằng sự hồi quy về mức trung bình tỷ lệ thuận với độ lệch của mẫu con cái so với cha mẹ chúng.

Galton rõ ràng là đã kỳ vọng cử tọa uyên thâm của mình tại Học viện Hoàng gia – Hiệp hội nghiên cứu độc lập lâu đời nhất trên thế giới kinh ngạc bởi “nhận xét đáng ghi nhớ” giống như ông đã từng nhận xét. Điều thực sự đáng ghi nhớ ở đây là ông đã kinh ngạc bởi một quy luật thống kê vốn dĩ rất bình thường và dễ hiểu, đơn giản như việc con người chúng ta hít thở không khí vậy. Các hiệu ứng hồi quy có thể được phát hiện ra ở bất cứ thứ gì chúng ta thấy nhưng chúng ta không hề hiểu chúng thực sự là gì. Chúng lẩn khuất trong cái nhìn giản đơn của chúng ta. Điều đó đã ngốn của Galton vài năm nghiên cứu để tìm ra mô hình hồi quy về tầm thước của thế hệ con cái cho tới khái niệm rộng hơn cho rằng sự hồi quy chắc chắn xảy ra khi mối tương giao giữa hai thước đo dưới chuẩn và ông đã áp dụng học thuyết của các nhà thống kê học hàng đầu của thời đại ông sống để kiểm chứng kết luận đó.

Một trong số hàng trăm trở ngại mà Galton cần phải vượt qua đó là bài toán đo lường sự hồi quy giữa các biến số được đo lường bởi các tỷ lệ khác nhau, ví dụ trọng lượng tương thích với việc chơi piano. Bài toán được giải quyết nhờ việc sử dụng chuẩn chung như là mức tham chiếu tiêu chuẩn. Hãy thử hình dung rằng trọng lượng thích hợp cho việc chơi đàn piano đã từng được đo lường ở 100 trẻ nhỏ ở đủ lứa tuổi đến từ một trường tiểu học và lũ trẻ này đã được phân hạng từ cao tới thấp với từng thước đo chuẩn. Nếu Jane xếp hạng 3 trong kỹ thuật chơi piano và thứ 27 về trọng lượng, có thể kết luận rằng cô bé là một nghệ sĩ piano “cừ” hơn so với chiều cao của mình. Chúng ta hãy cùng làm vài phép giả định sẽ giúp chúng ta dễ hiểu hơn:

Ở bất cứ lứa tuổi nào:

  • Việc chơi đàn piano tốt phụ thuộc duy nhất vào số giờ tập luyện trong tuần.
  • Trọng lượng cơ thể phụ thuộc duy nhất vào số lượng kem trẻ ăn.
  • Lượng kem tiêu thụ và số giờ tập hàng tuần không có liên quan gì.

Giờ hãy sử dụng các thứ hạng (hoặc các điểm chuẩn mà các nhà thống kê học ưa dùng), chúng ta có thể viết ra một vài phương trình như sau:

Trọng lượng = độ tuổi + lượng kem tiêu thụ

Chơi piano = độ tuổi + số giờ tập luyện hàng tuần

Bạn có thể thấy rằng ở đây sẽ có sự hồi quy về mức trung bình khi chúng ta dự đoán khả năng chơi piano từ trọng lượng cơ thể, hoặc ngược lại. Nếu tất cả những gì bạn được biết về Tom đó là cậu bé xếp thứ 12 về trọng lượng (khá cao so với mới trung bình ở tuổi của cậu), bạn có thể suy ra (qua thống kê) rằng cậu hẳn phải lớn hơn so với độ tuổi trung bình và hẳn cũng ăn nhiều kem hơn những đứa trẻ khác. Nếu tất cả những gì chúng ta biết về Barbara đó là cô bé xếp hạng 85 trong hạng mục piano (dưới mức trung bình của nhóm rất nhiều), bạn có thể suy ra rằng cô ta tài năng và có thể luyện tập ít hơn phần đông những đứa trẻ khác.

Hệ số tương quan giữa hai thước đo, thứ biến thiên giữa 0 và 1, là một thước đo thuộc trọng số tương đối về các yếu tố mà chúng cùng chung thuộc tính. Ví dụ, tất cả chúng ta đều có chung một nửa số gen di truyền với bố hoặc mẹ của mình, và đối với những đặc trưng mà trong đó các yếu tố môi trường có ảnh hưởng tương đối, ví dụ như chiều cao, mối tương quan giữa cha mẹ và con cái không vượt quá .50. Để hiểu đúng ý nghĩa của thước đo tương quan, hãy tìm hiểu một số ví dụ về các hệ số dưới đây:

  • Mối tương quan giữa kích thước của các vật thể được đo lường với độ chuẩn xác trong tiếng Anh hoặc các đơn vị (hệ mét) chuẩn đo là 1. Bất cứ yếu tố nào tác động tới một thước đo thì cũng ảnh hưởng tới cái còn lại; 100% các yếu tố quyết định (định thức) được dự phần.
  • Mối tương quan giữa chiều cao và trọng lượng trong số đàn ông trưởng thành người Mỹ là .41. Nếu bạn bao hàm cả phụ nữ và trẻ em, mối tương quan có thể sẽ cao hơn rất nhiều, bởi giới tính của cá thể và độ tuổi ảnh hưởng tới cả chiều cao lẫn cân nặng của họ, nâng trọng số tương quan của các yếu tố chung lên.
  • Mối tương quan giữa điểm số SAT và hệ số GPA là xấp xỉ .60. Tuy nhiên, mối tương quan giữa các bài kiểm tra năng khiếu với việc đỗ tốt nghiệp thấp hơn nhiều. Nếu mọi người cùng có năng khiếu như nhau, những khác biệt trong thước đo này không chắc đã chiếm một vai trò quan trọng đối với các thước đo thành công.
  • Mối tương quan giữa mức thu nhập với trình độ học vấn tại Mỹ xấp xỉ .40.
  • Mối tương quan giữa thu nhập gia đình với bốn số cuối số điện thoại của họ là 0.

Điều này đã ngốn của Francis Galton một vài năm nghiên cứu để ngộ ra rằng mối tương quan và sự hồi quy không phải là hai khái niệm mà là những phối cảnh khác nhau trên cùng một khái niệm. Quy tắc chung hoàn toàn không khó hiểu nhưng mang lại những hệ quả đáng ngạc nhiên là: Phải chăng sự tương quan giữa hai điểm số là không hoàn chỉnh, hay đó sẽ là sự hồi quy về mức trung bình. Để minh chứng cho sự hiểu biết sâu sắc của Galton, hãy lựa một tình huống mà hầu hết mọi người cảm thấy khá thú vị:

Những phụ nữ vô cùng thông minh có chiều hướng kết hôn với những người đàn ông kém thông minh hơn mình.

Bạn có thể bắt đầu một cuộc chuyện trò lý thú ở một bữa tiệc bằng cách cố gắng tìm kiếm câu trả lời cho tình huống trên, và bạn bè của bạn sẽ chẳng khó dễ gì mà không đáp lại câu hỏi của bạn. Ngay cả những người đã từng có một vài lần tiếp xúc với các con số thống kê cũng sẽ diễn giải một cách vô thức theo chiều hướng nhân quả. Một số người có thể nghĩ tới việc những người phụ nữ vô cùng thông minh muốn tránh sự ganh đua từ những người đàn ông cùng trình độ với họ, hoặc tới việc bị ép buộc phải thỏa hiệp trong sự chọn lựa của họ về người chồng bởi những người đàn ông thông minh không muốn cạnh tranh với những người phụ nữ thông minh. Những lý giải gượng gạo hơn sẽ được đặt ra tại một bữa tiệc thú vị. Giờ hãy xem xét tuyên bố sau:

Mối tương quan giữa các chỉ số thông minh của những người chồng/vợ thấp hơn mức chuẩn.

Tuyên bố này rõ ràng là đúng và chẳng chút thú vị gì. Ai có thể là người trông đợi sự tương quan đạt chuẩn? Chẳng có gì để lý giải ở đây cả. Nhưng lời phát biểu mà bạn đã thấy thú vị và lời phát biểu bạn thấy tầm phào lại ngang bằng nhau trên phương diện đại số. Nếu mối tương quan giữa sự thông minh của người chồng/vợ thấp hơn chuẩn (và nếu những người đàn ông và phụ nữ ở mức trung bình không khác nhau về độ thông minh), khi đó một khẳng định chắc chắn rằng đa số những người phụ nữ rất thông minh sẽ kết hôn với những người chồng kém thông minh hơn họ (và dĩ nhiên là ngược lại). Sự quan sát được hồi quy về mức trung bình không thể thú vị hơn hay hợp lý hơn trong mối tương quan không hoàn chỉnh này.

Hẳn bạn sẽ đồng cảm với khó khăn của Galton khi tìm hiểu khái niệm về sự hồi quy. Quả nhiên vậy, nhà thống kê học David Freedman đã nói rằng nếu đề tài hồi quy được đề cập đến trong một phiên tòa hình sự hoặc dân sự, bên nào phải lý giải sự hồi quy với thẩm phán sẽ là bên thua kiện. Tại sao công việc này lại khó khăn tới vậy? Lý do chính cho sự khó khăn ấy là chủ đề trở đi trở lại trong cuốn sách này: Trí não của chúng ta có khuynh hướng ngả về những lý giải mang tính nhân quả một cách mạnh mẽ và chúng không xoay xở tốt với “những số liệu thống kê không đáng kể”. Khi sự chú tâm của chúng ta được hướng đến một biến cố, trí nhớ liên kết sẽ tìm kiếm cho biến cố ấy một nguyên do, chính xác hơn là sự kích hoạt sẽ trải rộng một cách tự động tới bất cứ nguyên do nào đã được lưu trữ sẵn trong bộ nhớ của chúng ta. Các lý giải mang tính nhân quả sẽ được đưa ra khi sự hồi quy được nhận diện, nhưng chúng sẽ sai bởi sự thực là sự hồi quy về mức trung bình cần tới một sự lý giải nhưng không cần một nguyên nhân để chứng minh. Biến cố thu hút được sự chú ý của chúng ta trong vòng đấu gôn chính là sự sa sút thành tích thường xuyên của các gôn thủ đã thành công trong ngày thứ nhất. Lời giải thích tốt nhất cho tình huống này là những tay gôn nọ đã gặp may bất thường vào ngày hôm đó, nhưng giải thích này thiếu đi sức thuyết phục của tính nhân quả – thứ mà trí não chúng ta thích dùng hơn. Thay vào đó, chúng ta phải tốn rất nhiều công sức để có được những lý giải thú vị về các hiệu ứng hồi quy. Một nhà chuyên gia trong lĩnh vực kinh doanh – người đã tuyên bố một cách chính xác rằng “doanh nghiệp đã kinh doanh hiệu quả trong năm nay bởi vì đã từng kinh doanh kém hiệu quả trong năm ngoái”, chắc hẳn phát ngôn “ngu ngốc” đó chỉ được phát trên sóng phát thanh lần duy nhất đó. Những khó khăn của chúng tôi với khái niệm về sự hồi quy khởi nguồn từ cả Hệ thống 1 lẫn Hệ thống 2. Không có chỉ dẫn đặc biệt nào và khá ít các tình huống ngay cả sau khi có một vài chỉ dẫn dưới dạng thống kê, mối quan hệ giữa sự tương quan và sự hồi quy vẫn còn mơ hồ, khó lý giải. Hệ thống 2 thấy thật khó khăn để hiểu được và lĩnh hội được mối tương quan giữa chúng. Một phần là bởi do những ảnh hưởng trực tiếp của Hệ thống 1 về những lý giải mang tính nhân quả vốn là một đặc trưng của Hệ thống 1, không phải là thế mạnh của Hệ thống 2.

“Trẻ bị suy nhược đã được điều trị bằng một thức uống giàu năng lượng giúp cải thiện một cách đáng kể qua một liệu trình chữa trị kéo dài ba tháng.”

Tôi đã dựng lên tít báo ấy, nhưng thực tế những gì nó đề cập là đúng: Nếu bạn điều trị cho một nhóm gồm những đứa trẻ bị suy nhược trong một thời gian với một thức uống tăng lực, chúng sẽ được cải thiện sức khỏe đáng kể. Đây cũng chính là tình huống mà những đứa trẻ bị suy nhược đã dành ra một quãng thời gian để luyện tập trò trồng cây chuối hoặc ôm một chú mèo trong vòng 20 phút mỗi ngày cũng sẽ được cải thiện về sức khỏe tương tự như được điều trị bằng thức uống tăng lực. Hầu hết các “tác động giả” của những tựa đề kiểu như vậy sẽ khiến ta suy luận một cách tự động rằng thức uống tăng lực hoặc việc ôm mèo đã dẫn tới sự cải thiện đáng kể về sức khỏe, nhưng thực tế kết luận này lại hoàn toàn phi lý. Những đứa trẻ bị suy nhược là một nhóm tối thiểu, chúng bị suy nhược hơn so với hầu hết những đứa trẻ khác và sức khỏe của các nhóm tối thiểu này sẽ hồi quy về mức trung bình qua thời gian. Mối tương quan giữa các điểm số giảm sút trong các dịp kiểm tra sức khỏe liên tiếp thấp hơn mức chuẩn, bởi thế sẽ có sự hồi quy về mức trung bình: Những đứa trẻ bị suy nhược đến một mức độ nào đó sẽ trở nên khỏe mạnh hơn theo thời gian dù cho chúng chẳng ôm ấp con mèo nào cả và chẳng uống một lon Red Bull nào cả. Để có thể đi đến kết luận rằng một thức uống tăng lực hoặc bất cứ liệu pháp điều trị nào khác có hiệu quả, bạn cần phải so sánh một nhóm các bệnh nhân được hưởng liệu pháp đó với một “nhóm kiểm soát” vốn không hưởng bất cứ liệu pháp nào (hoặc tốt hơn là chỉ nhận một liều thuốc an thần). “Nhóm kiểm soát” được kỳ vọng là được cải thiện chỉ bởi sự hồi quy và mục tiêu của thực nghiệm là nhằm xác định xem liệu các bệnh nhân đã được điều trị có cải thiện sức khỏe hơn hay do sự hồi quy có thể lý giải cho kết quả đó hay không.

Các diễn giải mang tính nhân quả sai lầm về hiệu ứng hồi quy không bị giới hạn với những độc giả ở các tờ báo phổ thông. Nhà thống kê học Howard Wainer đã tổng kết một bản danh sách dài các nhà nghiên cứu xuất chúng đã mắc phải cùng một lỗi là phân vân giữa mối tương quan với quan hệ nhân quả. Các hiệu ứng hồi quy là một nguyên nhân phổ biến gây cản trở trong quá trình nghiên cứu. Và các nhà khoa học giàu kinh nghiệm đã có nỗi ám ảnh tích cực về cái bẫy suy luận nhân quả không có cơ sở để phát hiện ra các hiệu ứng hồi quy trong những tình huống tương tự.

Một trong những ví dụ yêu thích của tôi về các lỗi dự đoán trực giác được phỏng theo bài báo cáo Phỏng đoán trong việc ra quyết định của người quản lý mẫu mực của Max Bazerman:

Bạn là người dự đoán kinh doanh cho một chuỗi cửa hàng. Tất cả các cửa hàng đều giống nhau về kích cỡ và khu vực bày bán hàng hóa, nhưng các mặt hàng bày bán ở vị trí khác nhau, với đối thủ cạnh tranh và các yếu tố ngẫu nhiên. Bạn được cung cấp các kết quả kinh doanh của năm 2011 và được đề nghị dự đoán việc kinh doanh của năm 2012. Bạn đã được cung cấp tài liệu để chấp nhận dự đoán tổng thể của các nhà kinh tế học rằng việc kinh doanh sẽ tăng vọt về tổng thể là 10%. Bạn sẽ hoàn thiện bảng dưới đây ra sao?

Cửa hàng Năm 2011 Năm 2012
1 11.000.000 đô-la _________
2 23.000.000 đô-la _________
3 18.000.000 đô-la _________
4 29.000.000 đô-la _________
Tổng 61.000.000 đô-la 67.100.000 đô-la

 

Bằng việc đã từng đọc chương này, bạn biết rằng việc cộng vào 10% doanh số của mỗi cửa hàng là sai. Bạn muốn các dự đoán của mình cho kết quả ngược lại, việc ấy đòi hỏi phải cộng vào hơn 10% cho các cửa hàng có thành tích thấp và cộng vào (hoặc thậm chí là trừ đi) đối với các cửa hàng khác. Nhưng nếu bạn hỏi những người khác điều này, rất có khả năng bạn sẽ rơi vào tình huống khó xử: Tại sao bạn lại đi phiền nhiễu họ với một câu hỏi hiển nhiên như thế? Như Galton đã từng rất vất vả để khám phá ra khái niệm về sự hồi quy, vì thế khái niệm về sự hồi quy này còn lâu mới trở nên dễ hiểu với tất chúng ta.

BÀN VỀ SỰ HỒI QUY VỀ MỨC TRUNG BÌNH

“Cô ấy nói sự trải nghiệm đã dạy cô ta biết rằng chỉ trích có hiệu quả hơn ca ngợi. Cô ta không hiểu được rằng tất cả đều do “sự hồi quy về mức trung bình” quyết định.

“Có lẽ bài phỏng vấn lần hai của anh ấy kém ấn tượng hơn lần đầu bởi anh ấy lo lắng sẽ làm chúng tôi thất vọng, nhưng trên thực tế rất có khả năng trong lần phỏng vấn đầu tiên, anh ấy đã thể hiện xuất sắc một cách khác thường.”

“Tiến trình thẩm tra của chúng tôi rất tốt nhưng không hoàn hảo, vì thế chúng tôi nên lường trước đến sự hồi quy trong tiến trình thẩm tra này. Chúng tôi không nên ngạc nhiên rằng những ứng viên vô cùng xuất sắc thường không đáp ứng được những kỳ vọng của chúng tôi.”