Đến nội dung

Hình ảnh

Logic trong các bài kiểm tra thuốc

- - - - -

  • Please log in to reply
Chưa có bài trả lời

#1
bachocdien

bachocdien

    Hạ sĩ

  • Biên tập viên
  • 62 Bài viết
Vào ngày chủ nhật( ngày thi đấu đầu tiên của Thế vận hội 2012), việc phá vỡ kỉ lục một cách đáng kinh ngạc của vận động viên bơi lội người Trung Quốc Ye Shiwen đã gây ra sự nghi ngờ rằng có thể cô đã dùng thuốc (Doping) để nâng cao thành tích bơi lội của mình.Không có bằng chứng nào chống lại Shiwen, và giám đốc y tế của IOC cũng đã biện hộ cho cô ấy. Đây không phải là tranh cãi đầu tiên liên quan đến thuốc xuất hiện ở thế vận hội London 2012 và có lẽ sẽ còn có nhiều tranh cãi hơn nữa.Tuy nhiên, khi 1 vận động viên không vượt qua được bài kiểm tra thuốc, chúng ta có thể thực sự kết luận rằng họ đã gian lận được không? John Haign đã đặt ra bài toán đó.

Hình đã gửi
làm thế nào để biết 1 vận động viên
có thực sự gian lận?

Để tìm hiểu xem liệu một vận động viên có thể tìm được một lợi thế không công bằng bằng cách sử dụng thuốc hay không? Nhiều cuộc kiểm nghiệm đã được tiến hành. Chi tiết các cuộc kiểm tra đó phụ thuộc vào những chất bị cấm đang bị điều tra, nhưng logic phía sau những cuộc kiểm tra như vậy là giống nhau: một số đo lường được thực hiện và nếu giá trị của chúng vượt qua một ngưỡng thì điều này được xem là bằng chứng đầy đủ cho sự gian lận.

Làm thế nào để biết rằng 1 vận động viên không vượt qua bài kiểm tra về thuốc có thực sự gian lận, và những lời buộc tội có đáng tin cậy? Trong ngôn ngữ của xác suất, chúng ta tìm xác suất có điều kiện để vận động viên phạm tội vì họ không qua được bài kiểm tra Doping, kí hiệu là: Pr(có tội | thất bại). Cần có 3 con số để làm việc này. Thứ nhất là độ nhạy của cuộc kiểm tra: tỉ lệ người sử dụng thuốc không vượt qua được bài kiểm tra. Về mặt xác suất, đây là xác suất có điều kiện mà một người có tội ( sử dụng thuốc) đồng thời không vượt qua được bài kiểm tra, ta kí hiệu là: Pr(thất bại | có tội). Chúng ta hy vọng con số này là gần tới 100%. Con số thứ 2 là đặc tính của cuộc kiểm tra: tỷ lệ những người không sử dụng đồng thời vượt qua bài kiểm tra. Lại một lần nữa, con số này nên gần tới 100%, có nghĩa là Pr(thất bại | vô tội) nên gần đến 0. Số cuối cùng là tỷ lệ thực tế của người dùng thuốc trong số đông có liên quan, số đông đó là nhóm vận động viên có thể đã được kiểm tra. Rất khó để biết chính xác, nhưng chúng ta có thể ước tính 1 cách hợp.

Nếu chúng ta có 3 con số đó ta có thể sử dụng một kết quả toán học gọi là : lý thuyết của Bayes, cái mà có thể cho chúng ta câu trả lời. Lý thuyết đó chỉ ra rằng ta có thể làm việc dễ dàng hơn với tỷ lệ xác suất thay vì xác suất. Nhắc lại rằng: nếu xác suất 1 sự kiện xuất hiện là 80%, xác suất nó không xảy ra là 20%, vì vậy tỷ lệ xác suất là 80/20, hoặc 4/1; nếu thay đổi thành 90% thì tỷ lệ xác suất là 90/10, hoặc 9/1. Xác suất xác định tỷ lệ này và ngược lại.

Trước những bằng chứng về sử dụng thuốc đã được tìm thấy, xác suất xảy ra sự kiện”1 vận động viên được chọn ngẫu nhiên là 1 người gian lận” chỉ là tỷ lệ của những người gian lận trong số những người còn lại. Vì vậy ta sử dụng hình minh họa này để tìm ra giá trị tương ứng cho tỉ số xác suất này. Tỷ số này:

tỷ lệ những người gian lận/ tỷ lệ những người vô tội

Là tỷ số xác suất tiên nghiệm của những người phạm tội
Giả sử 1 vận động viên không vượt qua được bài kiểm tra. Chúng ta nên tìm tỷ số xác suất xác suất hậu nghiệm của những người sử dụng thuốc như thế nào? Đầu tiên tính sức nặng của bằng chứng (ảnh hưởng của bằng chứng đối với mức độ tin cậy), tức là xác định tỉ số

Pr( thất bại/có tội)/Pr( thất bại/vô tội)

bằng cách sử dụng độ nhảy và đặc trưng của cuộc kiểm tra nói trên. Bây giờ lý thuyết của Bayes sẽ nói cho ta biết câu trả lời ta đang tìm kiếm, tỷ lệ xác suất hậu nghiệm, chỉ đơn giản là nhân tỷ lệ xác suất tiên nghiệm với sức nặng của bằng chứng. Bạn có thể chuyển nó thành 1 giá trị xác suất nếu bạn muốn.

Những con số thường dễ hình dung hơn. Giả sử tỷ lệ gian lận là 1%, độ nhạy là 95%, và đặc trưng của bài kiểm tra cũng là 95%. Tỷ số xác suất trước là 1/99. Sức nặng của các bằng chứng là 95/5.( Bạn có đồng ý không? Hãy cẩn thận với định nghĩa của nó), vậy tỷ lệ xác suất hậu nghiệm của những người phạm tội là

$\frac{1}{99}\times \frac{95}{5}=\frac{19}{99}$

khoảng 0.19. Để chuyển từ tỷ lệ xác suất sang giá trị xác suất, chúng ta chia tỷ lệ này cho 1 cộng với chính nó:

$\frac{\frac{19}{99}}{1+\frac{19}{99}}=0.16$

Vậy ta có 1 xác suất khoảng 16%, xác suất này có lẽ sẽ gây thất vọng cho nhiều người. Mặc dù bài kiểm tra chỉ sai 5 lần trong số 100 trường hợp cả người có tội cũng như người vô tội nhưng nó vẫn là không đủ tốt. Vậy ta có thể đuổi một vài người ra khỏi Olympic chỉ với xác suất 16% là họ gian lận không?

Dù ban đầu cả độ nhạy và đăc trưng của cuộc kiểm tra đều đạt 95%, nhưng có thể thấy kết quả không được như yêu cầu. Hãy tưởng tượng có 10,000 người và 1% sử dụng thuốc. Nghĩa là có 9900 người trong sạch, và 100 người gian lận. chúng ta kỳ vọng rằng bài kiểm tra sẽ tìm được 95% những người gian lận, nhưng nó cũng sẽ chạm được tới 5% những người vô tội, tức 495 người khác. Vì vậy trong 590 vận động viên thất bại trong bài kiểm tra chỉ có 95 người trong số họ, 16%, là gian lận.
Chúng ta không thể kỳ vọng những bài kiểm tra có độ nhạy 100% hay độ đặc trưng 100%, sai sót sẽ xảy ra. Một cơ quan có thẩm quyền phải đặt lại ngưỡng để tạo thành 1 sự cân bằng có thể chấp nhận được giữa những sai lầm của các cáo buộc 1 vận động viên vô tội là có tội, và những sai lầm trong việc để những người sử dụng thuốc nhưng vượt qua bài kiểm tra là trong sạch.




1 người đang xem chủ đề

0 thành viên, 1 khách, 0 thành viên ẩn danh