Chào mừng các bạn đã quay trở lại! Trong ba bài học đầu tiên, chúng ta đã tập trung vào các phương pháp tinh chỉnh mô hình hồi quy tuyến tính, như Ridge và Lasso. Các phương pháp này hoạt động dựa trên việc “thu hẹp” các hệ số trong một khuôn khổ tuyến tính có sẵn. Hôm nay, chúng ta sẽ thực hiện một bước nhảy vọt về mặt tư duy và khám phá một họ phương pháp hoàn toàn khác, không hề giả định một mối quan hệ tuyến tính ngay từ đầu: các mô hình dựa trên cây. Hãy tưởng tượng thay vì cố gắng tìm một đường thẳng (hoặc một mặt phẳng) duy nhất khớp nhất với toàn bộ dữ liệu, chúng ta chia nhỏ dữ liệu thành các nhóm đơn giản hơn và đưa ra dự đoán riêng cho từng nhóm. Đây chính là triết lý đằng sau Cây hồi quy. Sau đó, chúng ta sẽ học cách kết hợp sức mạnh của hàng trăm, thậm chí hàng ngàn cây riêng lẻ để tạo ra …