Giới thiệu về kiểm định tỷ lệ và kiểm định dấu
An Introduction to the Test of a Proportion and the Sign test
Tóm tắt nội dung chuỗi bài viết
Trong thế giới của dữ liệu, không phải lúc nào chúng ta cũng làm việc với các biến số liên tục như thu nhập hay điểm số. Rất nhiều câu hỏi quan trọng trong kinh doanh, chính trị và khoa học xã hội xoay quanh các kết quả nhị phân: một khách hàng có mua hàng hay không? một cử tri có bỏ phiếu cho ứng cử viên A hay không? một bệnh nhân có phản ứng tích cực với phương pháp điều trị hay không? Trả lời những câu hỏi này đòi hỏi một bộ công cụ thống kê khác, tập trung vào việc phân tích tỷ lệ.
Chuỗi bài viết này sẽ đưa chúng ta vào thế giới của các kiểm định tỷ lệ, bắt đầu với một giả thuyết gốc đơn giản nhưng cực kỳ phổ biến: liệu một tỷ lệ trong tổng thể có bằng 50% hay không ($H_0: P = 0.50$). Giả thuyết này là nền tảng cho nhiều ứng dụng thực tế, từ việc xác định xem một đồng xu có công bằng hay không, cho đến việc đánh giá liệu một sản phẩm mới có được đa số thị trường ưa thích hay không. Chúng ta sẽ khám phá một công cụ thanh lịch và mạnh mẽ để giải quyết vấn đề này: Kiểm định Dấu (Sign Test), một phương pháp phi tham số không đòi hỏi các giả định khắt khe về phân phối dữ liệu.
Bên cạnh đó, chúng ta sẽ làm quen với một chỉ số độ ảnh hưởng mới, Cohen’s g, một thước đo cực kỳ trực quan về mức độ một tỷ lệ lệch khỏi mốc 50%. Cuối cùng, toàn bộ chuỗi bài học sẽ trang bị cho bạn kỹ năng sử dụng Stata để không chỉ thực hiện các kiểm định này mà còn tiến hành phân tích hiệu năng và xác định kích thước mẫu cần thiết. Mục tiêu là giúp bạn tự tin thiết kế và phân tích các cuộc khảo sát, thử nghiệm A/B, và các nghiên cứu khác liên quan đến kết quả nhị phân một cách khoa học và hiệu quả.
Cấu trúc chuỗi bài học
- Giới thiệu kiểm định dấu (sign test) và độ ảnh hưởng gBạn sẽ học cách thực hiện và diễn giải Kiểm định Dấu, một công cụ phi tham số linh hoạt.
- Phân tích hiệu năng cho kiểm định tỷ lệ trong StataGiúp bạn xác định khả năng phát hiện một sự chênh lệch tỷ lệ có thật trong nghiên cứu của mình.
- Xác định kích thước mẫu cho khảo sát và thử nghiệm A/BTrang bị kỹ năng thiết yếu để trả lời câu hỏi “cần bao nhiêu người?” cho các nghiên cứu về tỷ lệ.
- Bài tổng hợp: Lựa chọn giữa kiểm định tham số và phi tham sốTổng kết và thảo luận về vị trí của Kiểm định Dấu trong bộ công cụ của nhà kinh tế lượng.
Kiến thức tiên quyết
Mục tiêu học tập
Sau khi hoàn thành chuỗi bài viết này, các bạn sẽ có khả năng:
- Giải thích được logic và các trường hợp ứng dụng của Kiểm định Dấu và kiểm định tỷ lệ $P=0.50$.
- Thực hiện Kiểm định Dấu và kiểm định một tỷ lệ bằng các lệnh
signtestvàprtesttrong Stata. - Tính toán và diễn giải được độ ảnh hưởng Cohen’s g để đo lường tầm quan trọng thực tiễn của một chênh lệch tỷ lệ.
- Sử dụng lệnh
power oneproportionđể thực hiện phân tích hiệu năng và xác định kích thước mẫu cần thiết cho các nghiên cứu về tỷ lệ. - Áp dụng các kỹ năng này để lập kế hoạch và phân tích các thử nghiệm A/B, các cuộc thăm dò ý kiến, và các nghiên cứu khác có kết quả nhị phân.
Tài liệu tham khảo
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum. Chương 5 của cuốn sách này là tài liệu gốc và là nền tảng cho toàn bộ chuỗi bài viết.
- Siegel, S. (1956). Nonparametric statistics for the behavioral sciences. McGraw-Hill. Cung cấp một cái nhìn sâu sắc và kinh điển về Kiểm định Dấu và các phương pháp phi tham số khác.
Phụ lục: Dữ liệu mô phỏng cho chuỗi bài viết
Để giúp các bạn dễ dàng theo dõi và thực hành, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng xuyên suốt chuỗi bài viết. Bộ dữ liệu này mô tả một kịch bản A/B testing kinh điển trong marketing kỹ thuật số.
Bối cảnh: Một công ty thương mại điện tử muốn kiểm tra xem việc thay đổi màu sắc của nút “Mua ngay” từ màu xanh (phiên bản A) sang màu cam (phiên bản B) có làm tăng tỷ lệ khách truy cập nhấp vào nút đó hay không. Họ tiến hành một thử nghiệm, trong đó 200 khách truy cập được chọn ngẫu nhiên để xem một trong hai phiên bản.
Các bạn hãy chạy đoạn code Stata dưới đây để tạo ra bộ dữ liệu ab_test_data.dta. Hãy lưu nó vào thư mục làm việc của bạn để sử dụng cho các bài học tiếp theo.
* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho thử nghiệm A/B
* TÊN FILE: ab_test_data.dta
* SỐ QUAN SÁT: 200 khách truy cập
* ==================================================
* Xóa bộ nhớ và thiết lập số quan sát
clear
set obs 200
set seed 9988
* Tạo biến ID cho mỗi khách truy cập
gen visitor_id = _n
* Tạo biến nhóm: 0 = Phiên bản A (nút màu xanh), 1 = Phiên bản B (nút màu cam)
gen version = mod(_n-1, 2)
label define version_label 0 "A (Xanh)" 1 "B (Cam)"
label values version version_label
* Tạo biến kết quả: 1 = nhấp chuột, 0 = không nhấp chuột
* Giả định phiên bản A có tỷ lệ nhấp là 45%
* Giả định phiên bản B có tỷ lệ nhấp là 60% (tạo ra hiệu ứng thật để khám phá)
gen clicked = 0
replace clicked = 1 if version == 0 & runiform() < 0.45
replace clicked = 1 if version == 1 & runiform() < 0.60
* Mô tả dữ liệu
describe
tabulate version clicked, row
* Lưu dữ liệu để sử dụng cho các bài sau
save "ab_test_data.dta", replace
Bộ dữ liệu này mô phỏng một tình huống thực tế nơi chúng ta muốn so sánh hai tỷ lệ. Trong các bài học tiếp theo, chúng ta sẽ sử dụng nó để kiểm tra xem sự khác biệt 15 điểm phần trăm (60% so với 45%) có ý nghĩa thống kê hay không, đo lường độ ảnh hưởng của sự thay đổi màu sắc, và xem xét liệu một nghiên cứu với 200 người có đủ hiệu năng để phát hiện ra nó hay không.
📚 Bài tiếp theo: Giới thiệu Kiểm định Dấu (Sign Test) và độ ảnh hưởng g
💡 Lưu ý: Hãy đảm bảo đã chạy code Stata ở trên và lưu lại bộ dữ liệu. Việc chuẩn bị sẵn sàng sẽ giúp bạn tập trung hoàn toàn vào các khái niệm quan trọng trong bài học tiếp theo.