Chào mừng các bạn đến với bài học thứ năm! Trong tất cả các bài học từ trước đến nay, trọng tâm của chúng ta luôn là mô hình hóa giá trị trung bình có điều kiện, $E[y|\mathbf{x}]$. Chúng ta đã cố gắng tìm ra đường thẳng hoặc đường cong “khớp nhất” đi qua “trung tâm” của đám mây dữ liệu. Tuy nhiên, giá trị trung bình chỉ kể một phần của câu chuyện. Điều gì sẽ xảy ra nếu chúng ta quan tâm đến những người có thu nhập thấp nhất (ví dụ, phân vị thứ 10) hoặc những người có chi tiêu cao nhất (ví dụ, phân vị thứ 90)? Bài học hôm nay sẽ giới thiệu cho các bạn một công cụ cực kỳ mạnh mẽ và linh hoạt: Hồi quy Phân vị (Quantile Regression). Thay vì chỉ có một đường hồi quy duy nhất cho giá trị trung bình, phương pháp này cho phép chúng ta ước lượng nhiều đường hồi quy khác nhau cho các phân vị khác nhau của biến phụ thuộc. Điều này …