Đồng liên kết và mô hình VAR

Trong phân tích chuỗi thời gian, đặc biệt là với dữ liệu kinh tế vĩ mô, các nhà nghiên cứu thường xuyên đối mặt với các biến không dừng (non-stationary). Việc áp dụng mô hình hồi quy OLS truyền thống cho các biến này có thể dẫn đến một cạm bẫy kinh điển được gọi là “hồi quy giả” (spurious regression) – nơi các kết quả thống kê có vẻ ý nghĩa (R² cao, t-statistic lớn) nhưng thực chất lại không phản ánh mối quan hệ kinh tế thực sự. Vấn đề này đặt ra một thách thức lớn: làm thế nào để xây dựng mô hình đáng tin cậy cho các biến số kinh tế vốn có xu hướng vận động cùng nhau trong dài hạn, chẳng hạn như tiêu dùng và thu nhập, hay cung tiền và lạm phát?

Để giải quyết thách thức này, Clive Granger đã phát triển một khái niệm đột phá vào những năm 1980: Đồng liên kết (Cointegration). Lý thuyết đồng liên kết cung cấp một nền tảng vững chắc để kiểm tra và mô hình hóa các mối quan hệ cân bằng dài hạn giữa các chuỗi thời gian không dừng. Thay vì phải lấy sai phân và làm mất đi thông tin về mức độ, chúng ta có thể khám phá ra rằng một tổ hợp tuyến tính của các biến này lại là một chuỗi dừng, cho thấy chúng cùng chia sẻ một xu hướng ngẫu nhiên chung và luôn có xu hướng điều chỉnh về trạng thái cân bằng. Chuỗi bài viết này sẽ đưa bạn vào một hành trình khám phá sâu sắc các khái niệm và kỹ thuật hiện đại trong phân tích chuỗi thời gian, từ những ý tưởng nền tảng về đồng liên kết đến các ứng dụng mạnh mẽ của Mô hình Hiệu chỉnh Sai số (ECM) và Mô hình Tự hồi quy Vector (VAR). Với các ví dụ minh họa chi tiết bằng Stata, bạn sẽ được trang bị đầy đủ kiến thức để tự tin phân tích các mối quan hệ kinh tế phức tạp trong thực tế.

Cấu trúc chuỗi bài học

Bài 1: Giới thiệu đồng liên kết và Vấn đề Hồi quy giả – Khám phá các khái niệm nền tảng và tại sao phân tích đồng liên kết lại quan trọng.
Bài 2: Kiểm định đồng liên kết và Mô hình Hiệu chỉnh sai số (ECM) – Tìm hiểu cách kiểm định mối quan hệ dài hạn và mô hình hóa cơ chế điều chỉnh về trạng thái cân bằng.
Bài 3: Nền tảng Mô hình tự hồi quy véc-tơ (VAR) – Xây dựng nền tảng cho phân tích hệ thống đa biến, nơi các biến tác động qua lại lẫn nhau.
Bài 4: Phân tích động học trong mô hình VAR – Đi sâu vào các công cụ phân tích chính sách như Hàm phản ứng xung (IRF) và Phân rã phương sai.
Bài 5: Kiểm định đồng liên kết trong Hệ thống VAR (Phương pháp Johansen) – Nắm vững kỹ thuật kiểm định đồng liên kết mạnh mẽ trong môi trường đa biến.
Bài 6: Hướng dẫn thực hành tổng hợp với Stata – Áp dụng toàn bộ kiến thức vào một nghiên cứu tình huống hoàn chỉnh.

Kiến thức tiên quyết

Kinh tế lượng cơ bản: Hiểu biết về mô hình hồi quy OLS, các giả định cổ điển và các kiểm định giả thuyết.
Thống kê ứng dụng: Nắm vững các khái niệm về phân phối xác suất, ước lượng điểm, và khoảng tin cậy.
Phân tích chuỗi thời gian cơ bản: Quen thuộc với các khái niệm về tính dừng, tự tương quan, và kiểm định nghiệm đơn vị (ADF, PP).
Sử dụng Stata cơ bản: Có khả năng nhập dữ liệu, thực hiện các lệnh thống kê mô tả và hồi quy cơ bản.

Mục tiêu học tập

Nắm vững cơ sở lý thuyết về hồi quy giả, đồng liên kết, và các mô hình ECM, VAR, VECM.
Thành thạo việc triển khai các kỹ thuật này trong Stata, từ kiểm định nghiệm đơn vị đến ước lượng mô hình VECM và phân tích IRF.
Phát triển kỹ năng diễn giải kết quả một cách sâu sắc, liên kết ý nghĩa thống kê với lý thuyết kinh tế.
Xây dựng một quy trình làm việc hoàn chỉnh để phân tích mối quan hệ cân bằng dài hạn và động học ngắn hạn cho các dự án nghiên cứu thực tế.

Tài liệu tham khảo chính

Engle, R.F., & Granger, C.W.J. (1987). Co-integration and Error Correction: Representation, Estimation, and Testing. Econometrica. (Bài báo nền tảng khai sinh ra lĩnh vực này).
Johansen, S. (1995). Likelihood-Based Inference in Cointegrated Vector Autoregressive Models. Oxford University Press. (Tài liệu kinh điển về phương pháp kiểm định đồng liên kết trong hệ thống VAR).
Sims, C.A. (1980). Macroeconomics and Reality. Econometrica. (Bài báo tiên phong giới thiệu mô hình VAR trong kinh tế lượng vĩ mô).

PHỤ LỤC: Dữ liệu mô phỏng cho chuỗi bài viết

Để đảm bảo tính thực hành, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng thể hiện hai chuỗi thời gian không dừng và có quan hệ đồng liên kết. Dữ liệu này sẽ được dùng xuyên suốt các ví dụ trong chuỗi bài học.

Stata

* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG CHO CHUỖI BÀI HỌC
* Mục đích: Tạo 2 chuỗi I(1) có quan hệ đồng liên kết
* Tác giả: Professor of Econometrics
* ==================================================

clear
set obs 200
set seed 12345

* Tạo chuỗi thời gian
gen time = _n

* Tạo một cú sốc nhiễu trắng cho xu hướng chung
gen shock_common = rnormal(0, 1)

* Tạo một xu hướng ngẫu nhiên chung (common stochastic trend)
gen trend_rw = sum(shock_common)

* Tạo hai biến I(1) có quan hệ đồng liên kết
* Biến 1: gdp_sim (GDP mô phỏng)
gen gdp_sim = 1.5 * trend_rw + rnormal(0, 2)

* Biến 2: cons_sim (Tiêu dùng mô phỏng)
* Mối quan hệ dài hạn: cons_sim = 0.8 * gdp_sim
* cons_sim = 0.8 * (1.5 * trend_rw) + rnormal(0, 1.5)
* cons_sim = 1.2 * trend_rw + rnormal(0, 1.5)
gen cons_sim = 1.2 * trend_rw + rnormal(0, 1.5)

* Gắn nhãn cho các biến
label var time "Thời gian"
label var gdp_sim "GDP mô phỏng (I(1))"
label var cons_sim "Tiêu dùng mô phỏng (I(1))"

* Lưu dữ liệu
* save cointegration_sim_data.dta, replace

* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG CHO CHUỖI BÀI HỌC
* Mục đích: Tạo 2 chuỗi I(1) có quan hệ đồng liên kết
* Tác giả: Professor of Econometrics
* ==================================================

clear
set obs 200
set seed 12345

* Tạo chuỗi thời gian
gen time = _n

* Tạo một cú sốc nhiễu trắng cho xu hướng chung
gen shock_common = rnormal(0, 1)

* Tạo một xu hướng ngẫu nhiên chung (common stochastic trend)
gen trend_rw = sum(shock_common)

* Tạo hai biến I(1) có quan hệ đồng liên kết
* Biến 1: gdp_sim (GDP mô phỏng)
gen gdp_sim = 1.5 * trend_rw + rnormal(0, 2)

* Biến 2: cons_sim (Tiêu dùng mô phỏng)
* Mối quan hệ dài hạn: cons_sim = 0.8 * gdp_sim
* cons_sim = 0.8 * (1.5 * trend_rw) + rnormal(0, 1.5)
* cons_sim = 1.2 * trend_rw + rnormal(0, 1.5)
gen cons_sim = 1.2 * trend_rw + rnormal(0, 1.5)

* Gắn nhãn cho các biến
label var time "Thời gian"
label var gdp_sim "GDP mô phỏng (I(1))"
label var cons_sim "Tiêu dùng mô phỏng (I(1))"

* Lưu dữ liệu
* save cointegration_sim_data.dta, replace

Mô tả dữ liệu

time: Biến chỉ số thời gian, từ 1 đến 200.
gdp_sim: Biến GDP mô phỏng, được tạo ra từ một xu hướng ngẫu nhiên chung và nhiễu dừng. Đây là một quá trình tích hợp bậc một, I(1).
cons_sim: Biến Tiêu dùng mô phỏng, cũng được tạo ra từ cùng một xu hướng ngẫu nhiên chung, đảm bảo rằng nó có mối quan hệ đồng liên kết với gdp_sim. Đây cũng là một quá trình I(1).

Mối quan hệ đồng liên kết thực sự giữa hai biến này là cons_sim - 0.8*gdp_sim, là một quá trình dừng. Chúng ta sẽ sử dụng các kỹ thuật trong chuỗi bài học để “khám phá” lại mối quan hệ này.

📚 Bài tiếp theo: Giới thiệu đồng liên kết và Vấn đề Hồi quy giả

💡 Lưu ý: Hãy đảm bảo bạn đã nắm vững các kiến thức tiên quyết để có trải nghiệm học tập tốt nhất.