Bạn có thể giải câu đố con ếch không? △

Là một phần của loạt câu đố TED-Ed, sáng kiến giáo dục và giới trẻ của TED, đã phát hành một video có tên là Bạn có thể giải câu đố ếch không? Một đoạn video trình bày một câu đố về xác suất có điều kiện và giải quyết nó một cách đơn giản. Nhưng, liệu giải pháp có đúng không? Mọi người cho rằng nó không như vậy. Đối với những người muốn xem vấn đề được nêu chi tiết, bạn có thể xem video tại đây và đọc các bình luận bên dưới để hiểu cuộc tranh luận. Đối với phần còn lại của bạn, mình sẽ trình bày những điều cơ bản một cách đơn giản.

  • Có hai gốc cây, AB.
  • Gốc A có một con ếch.
  • Gốc B có hai con ếch.
  • Ếch có thể là con đực (M) hoặc con cái (F) với xác suất 50%.
  • Bạn muốn chọn gốc cây có xác suất cao nhất có một con ếch cái.


Không có thông tin nào khác, rõ ràng người ta sẽ chọn gốc cây B vì nó chứa hai con ếch chứ không phải một con. Tuy nhiên, trước khi bạn có thể chọn, bạn nghe thấy một tiếng kêu từ gốc cây B, đó là dấu hiệu của một con ếch đực. Bây giờ bạn biết rằng có ít nhất một con ếch đực trên gốc cây B. Bạn chọn gốc cây nào, và xác suất mà gốc cây đó chứa một con ếch cái là gì?

Điều làm cho vấn đề này đặc biệt thú vị là có tranh cãi về cách giải quyết chính xác, và giải pháp thực sự của nó là gì. Cụ thể, có hai dòng lý luận rất hợp lý tạo ra câu trả lời mâu thuẫn. Một được trình bày bởi TED trong video (bạn có thể nghe ở đây hoặc tiếp tục đọc để biết tóm tắt) và một được trình bày bởi những người xem trong phần bình luận.

Lời giải 1: TED’s

Ý tưởng đằng sau giải pháp TED sắp tới là bạn bắt đầu bằng cách xem xét không gian mẫu ban đầu trước khi bạn nghe thấy tiếng kêu của ếch. Không gian mẫu là tập hợp các khả năng cho giới tính của ếch trên gốc B. Những khả năng này là (MM), (MF), (FM) và (FF) trong đó chữ M và F chỉ đực và cái. Mỗi khả năng đều có xác suất như nhau.
Sau khi nghe thấy tiếng ếch kêu, chúng ta cập nhật không gian mẫu bằng cách sử dụng thông tin mới mà ta đã thu được. Đó là, sau khi nghe một tiếng kêu, chúng ta biết rằng gốc B không thể có hai con ếch cái vì ếch cái không có tiếng kêu. Do đó, chúng ta loại bỏ (FF) khỏi không gian mẫu. Bây giờ chúng ta có các khả năng còn lại: (MM), (MF) và (FM). Hai trong số ba khả năng này có chứa một con ếch cái, vì vậy xác suất một con ếch cái ở B là 2 trên 3, hoặc 66,7%. Rõ ràng, xác suất một con ếch cái ở gốc A chỉ là 50% vì chúng ta không biết gì về nó. Do đó, chúng ta chọn gốc cây B.

Lời giải 2:

Lời giải của TED là có lý. Tuy nhiên, nó cũng mâu thuẫn với một số lý luận đơn giản. Hãy nói rằng chúng ta xem xét gốc B với 2 con ếch có thể là đực hoặc cái. Khi chúng ta nghe thấy tiếng kêu, chúng ta biết rằng có ít nhất một con ếch đực. Chúng ta không biết con nào là đực nhưng điều đó không quan trọng. Bây giờ có một con ếch mà chúng ta biết là con đực và một con ếch mà chúng ta thực sự không biết gì về nó. Do 2 con ếch độc lập nên xác suất, nên khả năng con ếch thứ hai là cái vẫn là 1/2, hoặc 50%, và do đó xác suất gốc B chứa ếch cái là 50%. Do đó, sẽ không có sự khác biệt cho dù bạn chọn gốc A hay gốc B.

Lời giải 3: Bayes

Bây giờ chúng ta đã có 2 lời giải khác nhau và cả 2 đều có vẻ đúng, nhưng lại cho 2 kết quả khác nhau. Làm thế nào để ta biết được đâu thực sự là đáp án đúng. Để giải quyết việc này, chúng ta sẽ đưa bài toán về các ký hiệu toán học

  • C: Sự kiện tiếng ếch kêu được nghe thấy.
  • M2: Sự kiện có 2 con ếch cái.
  • M1: Sự kiện có 1 con ếch đực.
  • Pc: Xác suất tiếng ếch kêu được nghe thấy phát ra từ chỉ 1 con ếch trong một khoảng thời gian.

Mục tiêu: là tìm P(M2|C).

Áp dụng công thức Bayes:
Bây giờ chúng ta cần tính P(C) - Xác suất nghe được tiếng ếch kêu. Một điều quan trọng, P(C) là xác suât không có điều kiện của việc nghe thấy được tiếng ếch kêu. Mọi người thường lấy P(C) = 1 kể từ khi đã nghe thấy tiếng kêu, nhưng điều đó không đúng, P(C) đại diện cho xác suất nghe thấy nói chung. Bên cạnh đó, xác suất của một con ếch kêu là độc lập với tiếng kêu của con ếch khác. Đây là một giả định phổ biến trong xác suất và có vẻ hợp lý cho vấn đề này.
Bây giờ ta đã có P(C) = Pc - 0.25Pc ². Đơn giản đúng không?. Nhưng Pc là cái gì, như đã nêu ở trên Pc là Xác suất tiếng ếch kêu được nghe thấy phát ra từ chỉ 1 con ếch trong một khoảng thời gian, chúng ta sẽ bàn về nó sau. Bây giờ tính P(M2 | C) đã:

Giải quyết cuộc tranh luận

Chúng ta đã tính được P(M2 | C), nhưng nó không phải 1 con số vd như 66,7%, mà là 1 phương trình. Điều này có vẻ không đúng, nhưng vấn đề không thực sự có thể giải quyết theo cách nó được trình bày. Để có được một kết quả cụ thể đòi hỏi người ta phải đưa ra một giả định quan trọng: giá trị nào của Pc sẽ được sử dụng!.
Vì lý do này, hai lời giải 1 và 2 đều đúng tùy thuộc vào xác suất mà người ta quan sát thấy một tiếng kêu từ một con ếch đực duy nhất. Biểu đồ dưới đây biểu thị phạm vi giá trị của P (M₂ | C) cho các giá trị khác nhau của Pc (trong khoảng từ 0 đến 1).
( P(M₂|C) là trục Y, còn Pc là trục X)

Khi Pc tiến tới 0, (đó là khi xác suất quan sát thấy tiếng kêu của một con ếch đực là cực kỳ hiếm) thì xác suất có hai con ếch đực đạt tới 50%. Đáp án này trùng với lời giải 2.

Khi Pc tiến tới 1 (đó là khi xác suất quan sát tiếng kêu của một con ếch đực là cực kỳ phổ biến) thì xác suất có 2 con đực là 33% (tương đương với xác suất có ít nhất con ếch cái là 67%) Đáp án này trùng với lời giải 1 của TED.

Vì giá trị thực tế của Pc chắc chắn nằm ở đâu đó trong khoảng từ 0 đến 1, nên xác suất có ít nhất một con ếch cái ở gốc B sẽ cao hơn 50% và vì vậy, gốc cây B là lựa chọn tốt hơn.



Tại sao xác suất của việc nghe thấy tiếng kêu lại ảnh hưởng đến tất cả?. Chà, nếu tiếng kêu rất hiếm, chúng ta có thể quan sát nó với xác suất gấp đôi khi có hai con đực so với khi chỉ có một con. Tuy nhiên, khi tiếng kêu là hoàn toàn phổ biến, xác suất quan sát thấy tiếng kêu từ hai con đực (cùng lúc) là tương đương với một con đực. Mối quan hệ này có thể cảm thấy khó hiểu nhưng sự tương tác có thể được nhìn thấy trong lời giải thứ 3 với phương trình của P (C | M₂) ở trên.

Tài liệu tham khảo https://towardsdatascience.com/can-you-solve-teds-frog-riddle-can-ted-249db4f33c56