Trong các bài học trước, chúng ta đã xây dựng các mô hình phức tạp để phân tích biến phụ thuộc giới hạn, từ mô hình tĩnh đến mô hình động. Tuy nhiên, tất cả các phân tích đó đều dựa trên một giả định ngầm quan trọng: chúng ta có một bộ dữ liệu hoàn chỉnh hoặc dữ liệu bị thiếu một cách hoàn toàn ngẫu nhiên. Trong thực tế, giả định này hiếm khi được thỏa mãn. Các cuộc khảo sát dữ liệu bảng thường phải đối mặt với hiện tượng hao mòn mẫu (attrition), tức là các đối tượng rời khỏi mẫu nghiên cứu qua thời gian vì nhiều lý do như từ chối tham gia, chuyển đi, hoặc qua đời. Khi việc rời khỏi mẫu không diễn ra một cách ngẫu nhiên, nó sẽ gây ra sai lệch chọn mẫu (selection bias). Ví dụ, trong một nghiên cứu về tác động của đào tạo nghề đến thu nhập, những người có kết quả đào tạo kém có thể nản lòng và bỏ khảo sát. Nếu chúng …