Chào mừng các bạn đến với bài học thứ bảy và cũng là bài học lý thuyết cuối cùng trong chuỗi bài về Học máy! Ở bài trước, chúng ta đã học được hai phương pháp rất mạnh mẽ là Lựa chọn kép (DS) và Hậu điều chỉnh (PR) để thực hiện suy luận thống kê hợp lệ sau khi lựa chọn biến. Các phương pháp này đã giải quyết được một vấn đề lớn: làm thế nào để có được p-value và khoảng tin cậy đáng tin cậy cho một biến quan tâm trong môi trường đa chiều. Tuy nhiên, ngay cả những phương pháp tiên tiến này vẫn còn một điểm yếu tinh vi. Chúng thường sử dụng toàn bộ bộ dữ liệu để vừa ước lượng các mối quan hệ phụ trợ (ví dụ: mối quan hệ giữa các biến kiểm soát $X$ với $Y$ và $D$) vừa để ước lượng hệ số chính $\theta$. Việc “tái sử dụng” dữ liệu theo cách này có thể dẫn đến một loại thiên vị trong mẫu hữu hạn, một …
Các bài đã xem
- 26. Lựa chọn đa cấp
- Hướng dẫn thực hành với Stata
- Hiểu về nội sinh và biến công cụ
- So sánh các mô hình và các chủ đề mở rộng
- Giải bài toán OLS với nhiều biến
- Lựa chọn mô hình và suy luận thực hành
- Kiểm định và mô hình gián đoạn hồi quy mờ
- Hướng dẫn thực hành GMM từ A-Z với Stata
- Phân phối Mẫu của các Ước lượng OLS
- Ước lượng GMM cho mô hình bảng động
- Hàm phản ứng xung (IRF) và cách ước lượng
- Hướng dẫn thực hành OLS với Stata
- Tính nhất quán của ước lượng OLS
- Trọng tâm mô hình hiệu ứng cố định
- Giới thiệu về Đồng liên kết và Mô hình VECM
- Nhận dạng SVAR với ràng buộc dài hạn
- Các phương pháp kiểm định thay thế
- Lasso, Elastic Net và Lựa chọn biến
- Thuộc tính thống kê của các bộ ước lượng
-
Xem thêm