Trong quá trình phân tích dữ liệu, một trong những vấn đề đầu tiên và phổ biến nhất mà các nhà nghiên cứu phải đối mặt là sự hiện diện của các ngoại lệ (outliers). Một ngoại lệ là một quan sát khác biệt rõ rệt so với phần còn lại của mẫu. Chúng có thể xuất phát từ lỗi nhập liệu đơn thuần, nhưng cũng có thể là những giá trị hợp lệ nhưng cực đoan, đặc biệt trong các phân phối tài chính thường có “đuôi dày”. Vấn đề thực sự của ngoại lệ không nằm ở sự tồn tại của chúng, mà ở chỗ các phương pháp ước lượng tiêu chuẩn như OLS cực kỳ nhạy cảm với chúng. Một vài quan sát ngoại lệ có thể kéo đường hồi quy lệch đi đáng kể, biến chúng thành các quan sát có ảnh hưởng (influential observations) và làm sai lệch toàn bộ kết quả nghiên cứu. Bài học này sẽ trang bị cho bạn các công cụ để xác định và xử lý các ngoại lệ một …