Hiệu ứng điều trị trung bình cục bộ và thiết kế gián đoạn hồi quy

Chào mừng các bạn sinh viên đến với chuỗi bài học về hai trong số các phương pháp đánh giá tác động mạnh mẽ nhất trong kinh tế lượng hiện đại! Trong loạt bài này, chúng ta sẽ khám phá hai chủ đề có liên quan mật thiết: Tác động Điều trị Trung bình Cục bộ (LATE) và Thiết kế Hồi quy Gián đoạn (RDD). Đây là những công cụ bán thực nghiệm (quasi-experimental) vô cùng quan trọng, cho phép chúng ta xác định các tác động nhân quả ngay cả khi không có các thí nghiệm ngẫu nhiên hoàn hảo.

Chúng ta sẽ bắt đầu với LATE, một khái niệm được tiên phong bởi Angrist (1990), giúp làm rõ chính xác những gì mà phương pháp Biến Công cụ (IV) ước lượng được khi có sự không tuân thủ. Thay vì tìm thấy tác động trung bình cho toàn bộ dân số (ATE) – điều thường là không thể trong bối cảnh nội sinh – LATE tập trung vào một nhóm cụ thể gọi là “nhóm tuân thủ” (compliers). Sau đó, chúng ta sẽ chuyển sang RDD, một kỹ thuật mạnh mẽ khai thác các “ngưỡng” hoặc “điểm cắt” trong chính sách (ví dụ: ngưỡng điểm để nhận học bổng) để tái tạo lại các điều kiện của một thí nghiệm ngẫu nhiên, cho phép chúng ta so sánh những người ngay trên và ngay dưới ngưỡng đó để tìm ra tác động nhân quả. Mục tiêu của chuỗi bài học này là trang bị cho các bạn cả nền tảng lý thuyết vững chắc và kỹ năng thực hành Stata để tự tin áp dụng các phương pháp này trong nghiên cứu của mình.

Nền tảng LATE và ước lượng Wald
Chúng ta sẽ học về thí nghiệm ngẫu nhiên có tuân thủ không hoàn hảo và hiểu rõ bốn nhóm đối tượng tiềm năng.
Ước lượng LATE và hàm phản ứng trung bình (LARF)
Học cách ước lượng LATE trong thực tế và sử dụng phương pháp của Abadie để mô tả đặc điểm của nhóm tuân thủ.
LATE mở rộng và giới thiệu thiết kế hồi quy gián đoạn (RDD)
Tìm hiểu LATE khi có nhiều công cụ/điều trị và bắt đầu khám phá khái niệm cơ bản về RDD.
RDD sắc nét (Sharp RDD) và RDD mờ (Fuzzy RDD)
Đi sâu vào lý thuyết và phương pháp ước lượng cho hai loại RDD, bao gồm cả mối liên hệ giữa RDD mờ và LATE.
Các vấn đề thực hành RDD: Băng thông, đa thức và kiểm định
Nắm vững các kỹ thuật quan trọng nhất: cách chọn băng thông tối ưu, bậc đa thức và các kiểm định độ tin cậy của RDD.
Hướng dẫn thực hành LATE và RDD với Stata
Áp dụng tất cả lý thuyết đã học vào phân tích dữ liệu thực tế và dữ liệu mô phỏng bằng Stata, từ A đến Z.

KIẾN THỨC TIÊN QUYẾT

Kinh tế lượng cơ bản: Hiểu rõ về hồi quy OLS, vấn đề nội sinh (endogeneity) và thiên vị do biến bị bỏ sót (omitted variable bias).
Phương pháp Biến Công cụ (IV): Nắm vững khái niệm về biến công cụ, các giả định (liên quan, loại trừ) và ước lượng 2SLS (đã học ở Chương 3).
Mô hình Kết quả Tiềm năng (POM): Quen thuộc với ký hiệu \(Y_1\), \(Y_0\) và khái niệm về ATE, ATET (đã học ở Chương 1).
Stata cơ bản: Biết cách chạy lệnh regress và ivregress (hoặc ivreg).

MỤC TIÊU HỌC TẬP

Hiểu rõ LATE: Giải thích được LATE là gì, phân biệt 4 nhóm (Compliers, Never-Takers, Always-Takers, Defiers) và tại sao IV lại xác định LATE.
Nắm vững RDD: Phân biệt rõ ràng giữa Sharp RDD và Fuzzy RDD, và giải thích được trực giác “thí nghiệm tự nhiên tại ngưỡng”.
Thực hành Stata: Thực hiện ước lượng LATE (sử dụng ivregress) và cả Sharp lẫn Fuzzy RDD (sử dụng các lệnh chuyên dụng như rdrobust).
Tư duy Phản biện: Biết cách thực hiện các kiểm định độ tin cậy cho RDD (ví dụ: kiểm tra thao túng biến ép buộc) và hiểu rõ tầm quan trọng của việc chọn băng thông.

TÀI LIỆU THAM KHẢO

Chính: Cerulli, G. (2022). Econometric Evaluation of Socio-Economic Programs. Chương 4.
Kinh điển về LATE: Angrist, J. D. (1990). Lifetime earnings and the Vietnam era draft lottery.
Kinh điển về RDD: Thistlethwaite, D. L., & Campbell, D. T. (1960). Regression-discontinuity analysis.
Hướng dẫn thực hành RDD: Imbens, G. W., & Lemieux, T. (2008). Regression discontinuity designs: A guide to practice.
Sách giáo khoa bổ sung: Angrist, J. D., & Pischke, J. S. (2008). Mostly harmless econometrics. (Đây là tài liệu tham khảo tuyệt vời cho các chủ đề này).

Chúng ta sẽ không tạo bộ dữ liệu mô phỏng riêng cho chuỗi bài này, vì Mục 4.4 trong tài liệu gốc đã cung cấp các ví dụ thực hành rất chi tiết và các quy trình tạo dữ liệu (DGP) cụ thể cho cả LATE và RDD. Chúng ta sẽ đi thẳng vào việc phân tích các ví dụ này trong bài học cuối cùng để đảm bảo tính nhất quán với tài liệu học thuật.

📚 Bài tiếp theo: Nền tảng LATE và ước lượng Wald

💡 Lưu ý: Hãy đảm bảo bạn đã ôn lại kiến thức về Biến Công cụ (IV) từ Chương 3. Điều này rất quan trọng để hiểu được mối liên hệ giữa IV và LATE mà chúng ta sẽ thảo luận trong bài học đầu tiên.