Vấn đề dự báo và hạn chế của OLS The many-predictor problem and OLS Khi “nhiều hơn” không còn “tốt hơn” Trong kinh tế lượng, chúng ta thường đứng trước hai nhiệm vụ chính: ước lượng tác động nhân quả và dự báo. Như đã đề cập ở bài giới thiệu, việc tìm hiểu xem giảm sĩ số lớp học ảnh hưởng đến điểm thi như thế nào là một bài toán nhân quả. Ngược lại, việc dự đoán trường nào sẽ có điểm thi cao nhất dựa trên các đặc điểm sẵn có là một bài toán dự báo. Mục tiêu của dự báo không phải là tìm ra nguyên nhân, mà là xây dựng một mô hình có khả năng đưa ra những tiên đoán chính xác nhất cho các quan sát mới, hay còn gọi là các quan sát ngoại mẫu (out-of-sample). Khi chỉ có một vài biến dự báo, phương pháp hồi quy Bình phương nhỏ nhất (OLS) mà chúng ta đã quen thuộc hoạt động khá tốt. Tuy nhiên, trong thời đại dữ liệu …