Ước lượng hiệu ứng điều trị trung bình

Trong kinh tế lượng tài chính ứng dụng, một trong những thách thức lớn nhất là xác định các mối quan hệ nhân quả. Liệu một chính sách mới có thực sự cải thiện hiệu suất công ty? Một quyết định quản trị có tác động như thế nào đến giá trị cổ đông? Hay một sự kiện thị trường ảnh hưởng ra sao đến hành vi đầu tư? Để trả lời những câu hỏi này một cách khoa học, các nhà nghiên cứu thường dựa vào các phương pháp ước lượng hiệu ứng điều trị (treatment effect). Đây là thuật ngữ dùng để chỉ tác động nhân quả của một can thiệp (chính sách, sự kiện, quyết định) lên một kết quả cụ thể.

Tuy nhiên, việc ước lượng này không hề đơn giản. Các đối tượng (công ty, cá nhân) không được lựa chọn ngẫu nhiên để “nhận” điều trị, mà thường tự lựa chọn hoặc được lựa chọn dựa trên những đặc điểm nhất định. Điều này dẫn đến vấn đề nội sinh và sai lệch lựa chọn (selection bias), khiến việc so sánh trực tiếp giữa nhóm được điều trị và nhóm không được điều trị trở nên thiếu tin cậy. Hơn nữa, hiệu ứng của một điều trị có thể không đồng nhất, tức là tác động khác nhau trên các đối tượng khác nhau, làm nảy sinh thêm nhiều phức tạp trong việc xác định và diễn giải kết quả.

Chuỗi bài viết này sẽ cung cấp một cái nhìn tổng quan toàn diện và chuyên sâu về các phương pháp hiện đại để ước lượng hiệu ứng điều trị trung bình, với trọng tâm là các ứng dụng trong lĩnh vực tài chính. Dựa trên nền tảng của cuốn “Panel Methods for Finance” (Marno Verbeek, 2021), chúng ta sẽ khám phá từ các khái niệm nền tảng trong khung kết quả tiềm năng đến các kỹ thuật phức tạp hơn. Ba từ khóa chính xuyên suốt series này là: Phương pháp Khác biệt trong Khác biệt (DiD), Thiết kế Hồi quy Gián đoạn (RDD), và Các phương pháp So khớp (Matching Methods). Mục tiêu cuối cùng là trang bị cho người học không chỉ kiến thức lý thuyết vững chắc mà còn cả kỹ năng thực hành thành thạo trên Stata, giúp bạn tự tin áp dụng vào các nghiên cứu thực nghiệm của riêng mình.

Cấu trúc chuỗi bài học

  1. Bài 1: Khung kết quả tiềm năng và các khái niệm nền tảng
  2. Bài 2: Ước lượng với giả định độc lập có điều kiện
  3. Bài 3: Thiết kế hồi quy gián đoạn (RDD)
  4. Bài 4: Mô hình hồi quy chuyển mạch và biến công cụ (LATE)
  5. Bài 5: Phương pháp khác biệt trong khác biệt (DiD)
  6. Bài 6: Hướng dẫn thực hành ước lượng hiệu ứng điều trị với Stata

Kiến thức tiên quyết

  • Nền tảng toán học: Đại số tuyến tính, Giải tích.
  • Thống kê cơ bản: Lý thuyết xác suất, các phân phối thống kê, kiểm định giả thuyết.
  • Kinh tế lượng căn bản: Mô hình OLS và các giả định cổ điển.
  • Stata cơ bản: Thao tác dữ liệu, quản lý biến và thực thi các lệnh cơ bản.

Mục tiêu học tập

  • Nắm vững lý thuyết về các phương pháp ước lượng hiệu ứng điều trị và các giả định nhận dạng cốt lõi.
  • Vận dụng thành thạo Stata để thực hiện các kỹ thuật như Matching, RDD, IV, và DiD.
  • Diễn giải và phân tích kết quả một cách sâu sắc, nhận diện được các thách thức và hạn chế của từng phương pháp.

Tài liệu tham khảo chính

  • Verbeek, M. (2021). Panel Methods for Finance: A Guide to Panel Data Econometrics for Financial Applications. De Gruyter.
  • Angrist, J. D., & Pischke, J. S. (2009). Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton University Press.
  • Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press.
  • Cameron, A. C., & Trivedi, P. K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press.

Phụ lục: Dữ liệu mô phỏng cho chuỗi bài viết

Để minh họa cho các phương pháp sẽ được trình bày, chúng ta sẽ sử dụng một bộ dữ liệu bảng mô phỏng về tác động của một quy định môi trường mới lên hiệu quả hoạt động của các công ty. Quy định này được ban hành theo từng đợt (staggered adoption) cho các ngành công nghiệp khác nhau.

Stata
* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG: TÁC ĐỘNG CỦA QUY ĐỊNH MÔI TRƯỜNG
* Mục đích: Minh họa các phương pháp ước lượng hiệu ứng điều trị
* Dữ liệu: Dữ liệu bảng không cân bằng của 500 công ty trong 10 năm
* ==================================================

clear all
set obs 500
set seed 12345

* --- Tạo định danh công ty và ngành
gen firm_id = _n
gen industry = runiformint(1, 3)
label define industry_lbl 1 "Sản xuất" 2 "Công nghệ" 3 "Dịch vụ"
label values industry industry_lbl

* --- Mở rộng thành dữ liệu bảng (10 năm)
expand 10
bysort firm_id: gen year = 2010 + _n - 1
tsset firm_id year

* --- Tạo các đặc điểm công ty không đổi theo thời gian (fixed effects)
bysort firm_id: gen alpha_i = rnormal(0, 2) if _n == 1
bysort firm_id: replace alpha_i = alpha_i[_n-1] if _n > 1

* --- Tạo các đặc điểm công ty thay đổi theo thời gian
gen size = rnormal(10, 2) + 0.1*year + 0.5*alpha_i
gen leverage = runiform(0, 1) + 0.05*alpha_i

* --- Tạo biến điều trị (quy định được ban hành theo từng đợt)
gen regulation_year = .
replace regulation_year = 2015 if industry == 1 // Ngành Sản xuất bị ảnh hưởng từ 2015
replace regulation_year = 2017 if industry == 2 // Ngành Công nghệ bị ảnh hưởng từ 2017
* Ngành Dịch vụ (industry==3) là nhóm kiểm soát, không bao giờ bị ảnh hưởng

gen regulation = (year >= regulation_year) & (regulation_year != .)

* --- Tạo biến kết quả (Tobin's Q)
* Tobin's Q phụ thuộc vào size, leverage, fixed effects, xu hướng thời gian và điều trị
gen tobins_q = 1.5 + 0.2*size + 0.1*leverage + alpha_i + 0.05*(year-2010) + 1.2*regulation + rnormal(0, 1)

* --- Mô tả dữ liệu
describe
summarize firm_id year industry size leverage regulation tobins_q

Mô tả các biến trong dữ liệu

  • firm_id: Mã định danh duy nhất cho mỗi công ty.
  • year: Năm quan sát (từ 2010 đến 2019).
  • industry: Ngành công nghiệp của công ty (1: Sản xuất, 2: Công nghệ, 3: Dịch vụ).
  • size: Quy mô công ty (ví dụ: log của tổng tài sản).
  • leverage: Tỷ lệ đòn bẩy tài chính.
  • regulation: Biến giả, bằng 1 nếu công ty trong ngành và năm đó chịu tác động của quy định, và bằng 0 nếu ngược lại.
  • tobins_q: Biến kết quả, đo lường hiệu quả hoạt động và giá trị thị trường của công ty.

Bạn có thể tải về bộ dữ liệu mô phỏng này để thực hành song song với các bài học trong chuỗi.

Tải dữ liệu mô phỏng (.csv)

📚 Bài tiếp theo: Khung kết quả tiềm năng và các khái niệm nền tảng

💡 Lưu ý: Hãy đảm bảo bạn đã nắm rõ cấu trúc và mục tiêu của chuỗi bài học trước khi bắt đầu vào nội dung chi tiết.

Back to top button