Trong các bài học trước, chúng ta đã xây dựng một bộ công cụ vững chắc để xử lý các biến phụ thuộc nhị phân và biến liên tục bị kiểm duyệt. Tuy nhiên, các mô hình này đều dựa trên một giả định ngầm quan trọng: mẫu dữ liệu mà chúng ta có trong tay là một mẫu ngẫu nhiên từ tổng thể mà chúng ta muốn nghiên cứu. Điều gì sẽ xảy ra nếu giả định này bị vi phạm? Ví dụ, khi nghiên cứu về tiền lương của phụ nữ, chúng ta chỉ có thể quan sát lương của những người phụ nữ quyết định đi làm. Quyết định này không phải là ngẫu nhiên; nó có thể phụ thuộc vào chính những yếu tố quyết định mức lương của họ. Tình huống này dẫn đến một vấn đề nghiêm trọng gọi là thiên lệch chọn mẫu (sample selection bias). Bài học này sẽ giải quyết hai chủ đề nâng cao. Phần đầu tiên sẽ giới thiệu mô hình chọn mẫu Heckman, một phương pháp hai bước …

🔔 Khu vực THÀNH VIÊN
Bạn cần đăng ký một gói Thành viên để truy cập nội dung này.
Các gói hiện có:
Bạn đã có tài khoản → đăng nhập
Back to top button