Giới thiệu Ước lượng Hệ thống bằng Biến công cụ (SIV)

Chào mừng các bạn sinh viên đã quay trở lại với chuỗi bài học kinh tế lượng ứng dụng! Trong các chương trước, chúng ta đã làm quen với các công cụ mạnh mẽ để phân tích mối quan hệ kinh tế, từ hồi quy OLS, các mô hình SUR cho đến phương pháp biến công cụ (IV) cho một phương trình đơn lẻ. Tuy nhiên, thế giới kinh tế thực tế hiếm khi vận hành qua những phương trình riêng lẻ. Các biến số thường tác động qua lại lẫn nhau trong một hệ thống phức tạp, ví dụ như giá cả và sản lượng được quyết định đồng thời bởi cung và cầu. Khi đó, việc chỉ sử dụng các phương pháp cho phương trình đơn có thể dẫn đến những ước lượng chệch và không hiệu quả.

Đây chính là lúc các phương pháp ước lượng hệ thống bằng biến công cụ (System Instrumental Variables – SIV) phát huy vai trò của mình. Chuỗi bài học này sẽ là một hành trình thú vị, đưa chúng ta từ những khái niệm quen thuộc về biến công cụ lên một tầm cao mới, cho phép phân tích toàn bộ một hệ thống các phương trình có chứa các biến nội sinh. Cách tiếp cận hiện đại cho vấn đề này dựa trên một nguyên tắc vô cùng thanh lịch và tổng quát, đó là Phương pháp Mô-men Tổng quát (Generalized Method of Moments – GMM). GMM không chỉ là một công cụ ước lượng, mà còn là một khung tư duy mạnh mẽ giúp chúng ta giải quyết rất nhiều bài toán phức tạp trong kinh tế lượng.

Trong chuỗi bài này, chúng ta sẽ cùng nhau “giải phẫu” các khái niệm cốt lõi, từ việc xây dựng các điều kiện moment, lựa chọn ma trận trọng số tối ưu, cho đến việc áp dụng các ước lượng như 2SLS hệ thống (S2SLS) và 3SLS. Mục tiêu cuối cùng không chỉ là hiểu được lý thuyết, mà là để các bạn có thể tự tin vận dụng những kỹ thuật này vào các mô hình dữ liệu bảng hoặc mô hình phương trình đồng thời trong các bài nghiên cứu của riêng mình. Hãy chuẩn bị sẵn sàng, vì đây là một trong những bộ công cụ quan trọng nhất trong hành trang của một nhà kinh tế lượng hiện đại!

CẤU TRÚC CHUỖI BÀI HỌC

Giới thiệu SIV và các ví dụ nền tảng
Hiểu rõ tại sao cần ước lượng hệ thống và làm quen với các mô hình kinh tế kinh điển như cung-cầu lao động.
Nền tảng GMM và ước lượng 2SLS hệ thống
Xây dựng trực giác về GMM từ các điều kiện moment và áp dụng ước lượng S2SLS quen thuộc trong bối cảnh hệ thống.
Ma trận trọng số tối ưu và ước lượng 3SLS
Khám phá khái niệm cốt lõi của GMM là ma trận trọng số và học cách sử dụng ước lượng 3SLS để tăng hiệu quả.
So sánh GMM, GIV và các phương pháp khác
Tìm hiểu về ước lượng biến công cụ tổng quát (GIV) và so sánh các ưu, nhược điểm của các phương pháp hệ thống.
Kiểm định giả thuyết và ràng buộc thừa định danh
Học cách thực hiện suy diễn thống kê và kiểm tra tính hợp lệ của các biến công cụ trong mô hình hệ thống.
Hướng tới ước lượng hiệu quả và công cụ tối ưu
Khám phá các khái niệm nâng cao về cách lựa chọn và bổ sung biến công cụ để đạt được ước lượng hiệu quả nhất.
Thực hành phân tích cung-cầu lao động với Stata
Áp dụng toàn bộ kiến thức đã học để thực hiện một phân tích hệ phương trình hoàn chỉnh từ A-Z bằng Stata.
Tổng hợp chuỗi bài học về ước lượng hệ thống
Kết nối tất cả kiến thức, cung cấp cái nhìn toàn cảnh và định hướng cho các chủ đề nghiên cứu nâng cao hơn.

KIẾN THỨC TIÊN QUYẾT

Đại số tuyến tính: Thành thạo các phép toán ma trận (nhân, chuyển vị, nghịch đảo) là yêu cầu bắt buộc.
Xác suất thống kê: Nắm vững các khái niệm về kỳ vọng, phương sai, hiệp phương sai, và các định lý giới hạn.
Kinh tế lượng cơ bản: Hiểu rõ về ước lượng OLS, các giả định Gauss-Markov, và đặc biệt là phương pháp biến công cụ (IV) và Bình phương nhỏ nhất 2 giai đoạn (2SLS) cho phương trình đơn (Chương 5).
Stata cơ bản: Quen thuộc với các lệnh cơ bản như use, regress, summarize, và ivregress.

MỤC TIÊU HỌC TẬP

Sau khi hoàn thành chuỗi bài học này, các bạn sẽ có khả năng:

Giải thích được bản chất của tính nội sinh trong hệ thống phương trình và sự cần thiết của phương pháp biến công cụ hệ thống.
Nắm vững lý thuyết nền tảng của Phương pháp Mô-men Tổng quát (GMM) và vai trò của ma trận trọng số.
Vận dụng thành thạo Stata để thực hiện các ước lượng hệ thống như S2SLS và 3SLS.
Diễn giải và phân tích kết quả từ các mô hình hệ thống, cũng như thực hiện các kiểm định giả thuyết liên quan.
Phân biệt được các loại ước lượng khác nhau và lựa chọn phương pháp phù hợp cho các bài toán nghiên cứu cụ thể.

TÀI LIỆU THAM KHẢO

Wooldridge, J. M. (2010). Econometric analysis of cross section and panel data (2nd ed.). MIT press. (Tài liệu gốc cho chuỗi bài viết này).
Cameron, A. C., & Trivedi, P. K. (2005). Microeconometrics: Methods and applications. Cambridge university press. (Một tài liệu tham khảo tuyệt vời cho các ứng dụng kinh tế lượng vi mô).
Baltagi, B. H. (2021). Econometric analysis of panel data (6th ed.). Springer. (Tài liệu chuyên sâu về các mô hình dữ liệu bảng).

PHỤ LỤC: Dữ liệu mô phỏng cho series

Để giúp các bạn dễ dàng theo dõi và thực hành, tôi đã tạo một bộ dữ liệu mô phỏng dựa trên Ví dụ 8.1 (Hàm cung lao động và Hàm cung ứng tiền lương). Bộ dữ liệu này sẽ được sử dụng xuyên suốt trong các bài viết thực hành.

Stata

* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho hệ phương trình cung-cầu lao động
* SỐ QUAN SÁT: 1000 cá nhân
* ĐẶC ĐIỂM: Giờ làm việc (hours) và lương (wage) là nội sinh
* ==================================================

clear
set obs 1000
set seed 12345

* --- Tạo các biến ngoại sinh (công cụ) ---
* educ: số năm đi học (ảnh hưởng đến cả cung và cầu)
gen educ = 10 + 4*rnormal()
label var educ "Số năm đi học"

* nonlabor_inc: thu nhập ngoài lương (chỉ ảnh hưởng cung lao động)
gen nonlabor_inc = 5 + 2*rnormal()
label var nonlabor_inc "Thu nhập ngoài lương (nghìn USD)"

* experience: kinh nghiệm làm việc (chỉ ảnh hưởng cầu lao động)
gen experience = 5 + 2*rnormal()
label var experience "Số năm kinh nghiệm"

* --- Tạo các sai số có tương quan ---
matrix C = (1, 0.7 \ 0.7, 1)
drawnorm u1 u2, corr(C)

* --- Xây dựng hệ phương trình dạng rút gọn ---
* Đây là cách giải hệ phương trình để tìm ra giá trị cân bằng của hours và wage
* Dựa trên:
* (1) hours = a1*wage + b11*educ + b12*nonlabor_inc + u1  (Cung)
* (2) wage = a2*hours + b21*educ + b22*experience + u2   (Cầu)
* Giả sử các tham số: a1=0.8, b11=0.5, b12=-0.2, a2=0.1, b21=0.6, b22=0.3

gen hours = (1/(1-0.8*0.1)) * (0.8*(0.6*educ + 0.3*experience + u2) + 0.5*educ - 0.2*nonlabor_inc + u1)
gen wage = (1/(1-0.8*0.1)) * (0.1*(0.5*educ - 0.2*nonlabor_inc + u1) + 0.6*educ + 0.3*experience + u2)

* --- Làm tròn và điều chỉnh dữ liệu cho hợp lý ---
replace hours = max(0, round(hours, 0.1))
replace wage = max(1, round(wage, 0.1))

label var hours "Số giờ làm việc mỗi tuần"
label var wage "Lương mỗi giờ (USD)"

compress
save "labor_supply_demand.dta", replace

* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho hệ phương trình cung-cầu lao động
* SỐ QUAN SÁT: 1000 cá nhân
* ĐẶC ĐIỂM: Giờ làm việc (hours) và lương (wage) là nội sinh
* ==================================================

clear
set obs 1000
set seed 12345

* --- Tạo các biến ngoại sinh (công cụ) ---
* educ: số năm đi học (ảnh hưởng đến cả cung và cầu)
gen educ = 10 + 4*rnormal()
label var educ "Số năm đi học"

* nonlabor_inc: thu nhập ngoài lương (chỉ ảnh hưởng cung lao động)
gen nonlabor_inc = 5 + 2*rnormal()
label var nonlabor_inc "Thu nhập ngoài lương (nghìn USD)"

* experience: kinh nghiệm làm việc (chỉ ảnh hưởng cầu lao động)
gen experience = 5 + 2*rnormal()
label var experience "Số năm kinh nghiệm"

* --- Tạo các sai số có tương quan ---
matrix C = (1, 0.7 \ 0.7, 1)
drawnorm u1 u2, corr(C)

* --- Xây dựng hệ phương trình dạng rút gọn ---
* Đây là cách giải hệ phương trình để tìm ra giá trị cân bằng của hours và wage
* Dựa trên:
* (1) hours = a1*wage + b11*educ + b12*nonlabor_inc + u1  (Cung)
* (2) wage = a2*hours + b21*educ + b22*experience + u2   (Cầu)
* Giả sử các tham số: a1=0.8, b11=0.5, b12=-0.2, a2=0.1, b21=0.6, b22=0.3

gen hours = (1/(1-0.8*0.1)) * (0.8*(0.6*educ + 0.3*experience + u2) + 0.5*educ - 0.2*nonlabor_inc + u1)
gen wage = (1/(1-0.8*0.1)) * (0.1*(0.5*educ - 0.2*nonlabor_inc + u1) + 0.6*educ + 0.3*experience + u2)

* --- Làm tròn và điều chỉnh dữ liệu cho hợp lý ---
replace hours = max(0, round(hours, 0.1))
replace wage = max(1, round(wage, 0.1))

label var hours "Số giờ làm việc mỗi tuần"
label var wage "Lương mỗi giờ (USD)"

compress
save "labor_supply_demand.dta", replace

Mô tả các biến trong dữ liệu `labor_supply_demand.dta`

hours: Số giờ làm việc mỗi tuần (biến phụ thuộc, nội sinh).
wage: Lương mỗi giờ, đơn vị USD (biến phụ thuộc, nội sinh).
educ: Số năm đi học (biến ngoại sinh, công cụ).
nonlabor_inc: Thu nhập ngoài lương, đơn vị nghìn USD (biến ngoại sinh, công cụ cho phương trình cầu).
experience: Số năm kinh nghiệm làm việc (biến ngoại sinh, công cụ cho phương trình cung).

Bạn có thể chạy đoạn code Stata trên để tự tạo ra file dữ liệu và chuẩn bị cho các bài học tiếp theo. Chúc các bạn học tốt!