Mô hình đa biến

Giới thiệu chuỗi bài học

Chào mừng các bạn sinh viên đã quay trở lại với hành trình khám phá kinh tế lượng! Trong các chương trước, chúng ta đã cùng nhau làm chủ các mô hình hồi quy đơn phương trình, nơi một biến phụ thuộc được giải thích bởi một hoặc nhiều biến độc lập. Cách tiếp cận này rất mạnh mẽ, nhưng nó dựa trên một giả định quan trọng: mối quan hệ nhân quả chỉ đi theo một chiều. Tuy nhiên, trong thế giới kinh tế và tài chính thực tế, các mối quan hệ thường phức tạp hơn nhiều. Giá cả ảnh hưởng đến lượng cầu, nhưng đồng thời lượng cầu cũng tác động ngược trở lại giá cả. Lợi nhuận ngân hàng và mức độ cạnh tranh trong ngành có thể cùng nhau được quyết định. Khi các biến số tác động qua lại lẫn nhau, các phương pháp chúng ta đã học sẽ không còn phù hợp và có thể dẫn đến những kết luận sai lầm.

Chuỗi bài học này sẽ trang bị cho các bạn những công cụ cần thiết để phân tích các hệ thống phức tạp đó. Chúng ta sẽ bắt đầu bằng việc tìm hiểu Hệ phương trình đồng thời (SEM), khám phá lý do tại sao ước lượng OLS thông thường lại bị chệch và làm thế nào để khắc phục thông qua các kỹ thuật như Bình phương tối thiểu hai giai đoạn (2SLS). Sau đó, chúng ta sẽ chuyển sang một cách tiếp cận hiện đại và linh hoạt hơn là Mô hình Tự hồi quy Vector (VAR). Đây là một công cụ cực kỳ hữu ích để phân tích động lực học và dự báo trong các hệ thống có nhiều biến số tương tác mà không cần áp đặt các giả định chặt chẽ từ lý thuyết kinh tế. Các khái niệm cốt lõi mà chúng ta sẽ cùng nhau chinh phục bao gồm:

Hệ phương trình đồng thời (Simultaneous Equation Models – SEM): Các mô hình trong đó nhiều biến phụ thuộc được quyết định cùng lúc trong một hệ thống các phương trình có liên quan đến nhau.
Vấn đề nhận dạng (Identification Problem): Điều kiện tiên quyết để chúng ta có thể ước lượng một cách duy nhất các tham số trong mô hình cấu trúc từ dữ liệu quan sát được.
Mô hình Tự hồi quy Vector (Vector Autoregressive – VAR): Một phương pháp mô hình hóa chuỗi thời gian đa biến, trong đó mỗi biến được hồi quy theo các giá trị trễ của chính nó và của tất cả các biến khác trong hệ thống.

Mục tiêu của chuỗi bài viết không chỉ dừng lại ở việc giới thiệu lý thuyết. Quan trọng hơn, chúng ta sẽ học cách áp dụng những kiến thức này vào thực tế thông qua các ví dụ minh họa và hướng dẫn thực hành chi tiết với phần mềm Stata. Kết thúc chuỗi bài này, các bạn sẽ có khả năng nhận diện các vấn đề về tính đồng thời, lựa chọn phương pháp ước lượng phù hợp, và diễn giải kết quả từ các mô hình đa biến một cách tự tin.

Tại sao mô hình đơn phương trình là chưa đủ?
Chúng ta sẽ tìm hiểu về hệ phương trình đồng thời và khám phá tại sao phương pháp OLS truyền thống lại cho kết quả bị chệch.
Vấn đề nhận dạng trong hệ phương trình
Bài học này tập trung vào các điều kiện cần thiết để có thể ước lượng được một mô hình, một bước cực kỳ quan trọng trong phân tích.
Các phương pháp ước lượng cho hệ phương trình đồng thời
Chúng ta sẽ học các kỹ thuật ước lượng chuyên biệt như Bình phương tối thiểu hai giai đoạn (2SLS) và Biến công cụ (IV) để giải quyết vấn đề.
Giới thiệu mô hình tự hồi quy vector (VAR)
Khám phá một cách tiếp cận thay thế mạnh mẽ và linh hoạt để mô hình hóa các mối quan hệ tương tác giữa nhiều chuỗi thời gian.
Phân tích động lực học trong mô hình VAR
Học cách sử dụng các công cụ diễn giải cốt lõi của VAR như kiểm định nhân quả Granger, phản ứng xung lực và phân rã phương sai.
Hướng dẫn thực hành mô hình VAR với Stata
Áp dụng tất cả kiến thức đã học vào một bài phân tích hoàn chỉnh từ A-Z, từ việc chuẩn bị dữ liệu, lựa chọn độ trễ tối ưu, ước lượng mô hình cho đến diễn giải kết quả một cách sâu sắc.

KIẾN THỨC TIÊN QUYẾT

Đại số tuyến tính: Hiểu biết cơ bản về ma trận và các phép toán trên ma trận (chuyển vị, nghịch đảo).
Thống kê căn bản: Các khái niệm về kỳ vọng, phương sai, hiệp phương sai và các kiểm định giả thuyết (t-test, F-test).
Kinh tế lượng nhập môn: Nắm vững mô hình hồi quy tuyến tính cổ điển (CLRM), các giả định và ý nghĩa của ước lượng OLS.
Stata cơ bản: Quen thuộc với các lệnh cơ bản như use, summarize, regress, và quản lý dữ liệu.

MỤC TIÊU HỌC TẬP

Hiểu sâu lý thuyết: Nắm vững các khái niệm về tính đồng thời, vấn đề nhận dạng, và cấu trúc của mô hình VAR.
Phân biệt mô hình: Nhận biết được khi nào cần sử dụng mô hình hệ phương trình đồng thời thay vì mô hình đơn phương trình.
Thực hành thành thạo: Sử dụng Stata để ước lượng các mô hình 2SLS và VAR, lựa chọn độ trễ tối ưu và thực hiện các kiểm định cần thiết.
Diễn giải chuyên sâu: Có khả năng phân tích kết quả từ các kiểm định nhân quả, hàm phản ứng xung lực và phân rã phương sai để rút ra kết luận kinh tế có ý nghĩa.

TÀI LIỆU THAM KHẢO

Chính: Brooks, C. (2019). Introductory Econometrics for Finance. Cambridge University Press. (Chương 7).
Bổ sung (Lý thuyết): Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach. Cengage Learning.
Bổ sung (Thực hành): Cameron, A. C., & Trivedi, P. K. (2010). Microeconometrics Using Stata. Stata Press.
Nâng cao (VAR): Lütkepohl, H. (2005). New Introduction to Multiple Time Series Analysis. Springer.

PHỤ LỤC: Dữ liệu mô phỏng cho chuỗi bài viết

Để giúp các bạn dễ dàng thực hành theo các bài học, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng đơn giản về các chỉ số kinh tế vĩ mô của một quốc gia giả định. Bộ dữ liệu này sẽ được sử dụng nhất quán trong suốt chuỗi bài viết, đặc biệt là trong các bài học về VAR.

Hãy mở Stata, chạy đoạn code dưới đây để tạo và lưu bộ dữ liệu có tên macro_data.dta vào thư mục làm việc của bạn.

Stata

* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG CHO CHUỖI BÀI HỌC VỀ MÔ HÌNH ĐA BIẾN
* Mục đích: Tạo bộ dữ liệu chuỗi thời gian quý với 3 biến vĩ mô
* Các biến: Tăng trưởng GDP, Tỷ lệ lạm phát, Lãi suất chính sách
* ==================================================

* Xóa bộ nhớ và thiết lập số quan sát
clear
set obs 200

* Đặt seed để đảm bảo kết quả có thể tái lập
set seed 12345

* Tạo biến thời gian (quý)
gen time = tq(1970q1) + _n-1
format time %tq
tsset time

* --- Tạo biến Lãi suất chính sách (interest_rate) ---
* Giả định lãi suất tuân theo quy trình AR(1) với sự thay đổi cấu trúc
gen interest_rate = 0.5 in 1
replace interest_rate = 0.8 * L.interest_rate + rnormal(0, 0.5) in 2/100
replace interest_rate = 0.9 * L.interest_rate - 1 + rnormal(0, 0.75) in 101/l
replace interest_rate = interest_rate + 4 // Điều chỉnh mức trung bình

* --- Tạo biến Tỷ lệ lạm phát (inflation) ---
* Lạm phát bị ảnh hưởng bởi lãi suất trễ và cú sốc của chính nó
gen inflation = 0.2 in 1
replace inflation = 0.5 * L.inflation - 0.2 * L.interest_rate + rnormal(0, 0.6) in 2/l
replace inflation = inflation + 2.5 // Điều chỉnh mức trung bình

* --- Tạo biến Tăng trưởng GDP (gdp_growth) ---
* Tăng trưởng GDP bị ảnh hưởng bởi lạm phát trễ và lãi suất trễ
gen gdp_growth = 0.8 in 1
replace gdp_growth = 0.3 * L.gdp_growth - 0.25 * L.inflation - 0.15 * L.interest_rate + rnormal(0, 1) in 2/l
replace gdp_growth = gdp_growth + 3 // Điều chỉnh mức trung bình

* Thêm nhãn cho các biến để dễ nhận biết
label var gdp_growth "Tăng trưởng GDP thực (%)"
label var inflation "Tỷ lệ lạm phát hàng năm (%)"
label var interest_rate "Lãi suất chính sách (%)"

* Xem qua 10 quan sát đầu tiên
list in 1/10

* Lưu bộ dữ liệu để sử dụng cho các bài học sau
save macro_data.dta, replace

* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG CHO CHUỖI BÀI HỌC VỀ MÔ HÌNH ĐA BIẾN
* Mục đích: Tạo bộ dữ liệu chuỗi thời gian quý với 3 biến vĩ mô
* Các biến: Tăng trưởng GDP, Tỷ lệ lạm phát, Lãi suất chính sách
* ==================================================

* Xóa bộ nhớ và thiết lập số quan sát
clear
set obs 200

* Đặt seed để đảm bảo kết quả có thể tái lập
set seed 12345

* Tạo biến thời gian (quý)
gen time = tq(1970q1) + _n-1
format time %tq
tsset time

* --- Tạo biến Lãi suất chính sách (interest_rate) ---
* Giả định lãi suất tuân theo quy trình AR(1) với sự thay đổi cấu trúc
gen interest_rate = 0.5 in 1
replace interest_rate = 0.8 * L.interest_rate + rnormal(0, 0.5) in 2/100
replace interest_rate = 0.9 * L.interest_rate - 1 + rnormal(0, 0.75) in 101/l
replace interest_rate = interest_rate + 4 // Điều chỉnh mức trung bình

* --- Tạo biến Tỷ lệ lạm phát (inflation) ---
* Lạm phát bị ảnh hưởng bởi lãi suất trễ và cú sốc của chính nó
gen inflation = 0.2 in 1
replace inflation = 0.5 * L.inflation - 0.2 * L.interest_rate + rnormal(0, 0.6) in 2/l
replace inflation = inflation + 2.5 // Điều chỉnh mức trung bình

* --- Tạo biến Tăng trưởng GDP (gdp_growth) ---
* Tăng trưởng GDP bị ảnh hưởng bởi lạm phát trễ và lãi suất trễ
gen gdp_growth = 0.8 in 1
replace gdp_growth = 0.3 * L.gdp_growth - 0.25 * L.inflation - 0.15 * L.interest_rate + rnormal(0, 1) in 2/l
replace gdp_growth = gdp_growth + 3 // Điều chỉnh mức trung bình

* Thêm nhãn cho các biến để dễ nhận biết
label var gdp_growth "Tăng trưởng GDP thực (%)"
label var inflation "Tỷ lệ lạm phát hàng năm (%)"
label var interest_rate "Lãi suất chính sách (%)"

* Xem qua 10 quan sát đầu tiên
list in 1/10

* Lưu bộ dữ liệu để sử dụng cho các bài học sau
save macro_data.dta, replace

Hướng dẫn sử dụng:

Sao chép toàn bộ đoạn code trên.
Mở Stata và mở một Do-file mới (File > New > Do-file).
Dán code vào cửa sổ Do-file.
Chọn tất cả code (Ctrl+A) và thực thi (Execute Selection – Ctrl+D).
Một file có tên macro_data.dta sẽ được lưu trong thư mục làm việc hiện tại của Stata. Chúng ta sẽ sử dụng file này trong các bài học tới.

📚 Bài tiếp theo: Tại sao mô hình đơn phương trình là chưa đủ?

💡 Lưu ý: Hãy đảm bảo bạn đã chạy code và tạo thành công file dữ liệu macro_data.dta. Việc chuẩn bị sẵn sàng dữ liệu sẽ giúp quá trình học tập ở các bài sau diễn ra suôn sẻ hơn!