Lựa chọn mô hình dự báo trong kỷ nguyên dữ liệu lớn Synthesis: Choosing a predictive model in the era of big data 1. Bức tranh lớn về dự báo hiện đại Chúng ta đã hoàn thành một hành trình khám phá thế giới dự báo với nhiều biến, một lĩnh vực nằm ở giao điểm của kinh tế lượng truyền thống và khoa học dữ liệu hiện đại. Chuỗi bài học này bắt đầu bằng việc chỉ ra một sự thật quan trọng: các phương pháp kinh điển như OLS, vốn được thiết kế cho các bài toán có ít biến, sẽ thất bại khi đối mặt với sự bùng nổ của dữ liệu. Hiện tượng “khớp quá mức” (overfitting) không còn là một rủi ro lý thuyết mà trở thành một thách thức thực tế, khiến các mô hình OLS trở nên bất ổn và dự báo kém hiệu quả trên dữ liệu mới. Để giải quyết vấn đề này, chúng ta đã được trang bị một bộ công cụ hoàn toàn mới, bao gồm Hồi quy …