Vấn đề kiểm định bội và cách xử lý The problem of multiple testing and how to address it Cạm bẫy của những khám phá “tình cờ” Hãy tưởng tượng bạn đang thực hiện một nghiên cứu và kiểm định 20 giả thuyết khác nhau, mỗi giả thuyết ở mức ý nghĩa 5%. Mức ý nghĩa 5% có nghĩa là ngay cả khi giả thuyết không (H0) hoàn toàn đúng, vẫn có 5% khả năng chúng ta sẽ bác bỏ nó một cách sai lầm (đây là sai lầm loại I). Vậy, khi bạn thực hiện 20 kiểm định độc lập, xác suất để bạn không mắc phải sai lầm loại I nào cả là bao nhiêu? Con số đó là $(1 – 0.05)^{20} \approx 0.36$, tức là chỉ 36%! Điều này có nghĩa là có đến 64% khả năng bạn sẽ tìm thấy ít nhất một kết quả “có ý nghĩa thống kê” một cách hoàn toàn ngẫu nhiên, ngay cả khi không có bất kỳ tác động thực sự nào tồn tại. Đây chính là cốt lõi …

🔔 Khu vực THÀNH VIÊN
Bạn cần đăng ký một gói Thành viên để truy cập nội dung này.
Các gói hiện có:
Bạn đã có tài khoản → đăng nhập
Back to top button