Mô hình hóa chuỗi thời gian dừng

Sau khi nắm vững các khái niệm nền tảng về quá trình tạo dữ liệu và tính dừng trong chuỗi bài học trước, chúng ta sẽ tiến một bước sâu hơn vào thế giới của mô hình hóa kinh tế lượng. Nếu “tính dừng” là trạng thái cân bằng thống kê mà chúng ta mong muốn ở dữ liệu, thì câu hỏi tiếp theo là: “Những cấu trúc hay quy luật nào chi phối sự dao động của một chuỗi thời gian dừng?”. Việc trả lời câu hỏi này không chỉ giúp chúng ta hiểu rõ hơn về động lực học của các biến kinh tế mà còn là nền tảng để xây dựng các mô hình dự báo hiệu quả.

Chuỗi bài học này sẽ tập trung vào các mô hình đơn biến kinh điển dùng để mô tả các chuỗi thời gian dừng. Chúng ta sẽ giải mã ba “viên gạch” cơ bản của phân tích chuỗi thời gian: quá trình Tự hồi quy (AR), quá trình Trung bình trượt (MA), và mô hình kết hợp ARMA. Song song đó, chúng ta sẽ được trang bị hai công cụ chẩn đoán cực kỳ mạnh mẽ là Hàm tự tương quan (ACF)Hàm tự tương quan riêng phần (PACF). Việc phân tích hình dạng của hai hàm này, hay còn gọi là biểu đồ tương quan (correlogram), chính là nghệ thuật “bắt bệnh” cho một chuỗi thời gian, giúp nhà nghiên cứu nhận dạng được mô hình tiềm ẩn đã tạo ra dữ liệu. Mục tiêu cuối cùng là giúp bạn không chỉ hiểu lý thuyết mà còn có thể tự tin sử dụng Stata để phân tích ACF/PACF và đưa ra những nhận định ban đầu về cấu trúc của bất kỳ chuỗi thời gian dừng nào.

Cấu trúc chuỗi bài học

  1. Bài 1: Khám phá Quá trình Tự hồi quy (AR) và Điều kiện Dừng
  2. Bài 2: Mô hình Trung bình trượt (MA) và Quá trình ARMA
  3. Bài 3: Phân tích Cấu trúc Tương quan: Hàm ACF và PACF
  4. Bài 4: Thực hành Nhận dạng Mô hình Chuỗi thời gian với Stata

Kiến thức tiên quyết

  • Kinh tế lượng chuỗi thời gian cơ bản: Hiểu rõ khái niệm tính dừng, tính không dừng và quá trình tạo dữ liệu (DGP).
  • Đại số tuyến tính: Quen thuộc với các khái niệm về đa thức, nghiệm của phương trình.
  • Thống kê suy luận: Nắm vững các khái niệm về hàm tương quan và kiểm định giả thuyết.
  • Stata cơ bản: Có khả năng quản lý dữ liệu và thực hiện các lệnh thống kê mô tả cơ bản.

Mục tiêu học tập

  • Phân biệt và mô tả được các quá trình AR, MA, và ARMA.
  • Nắm vững các điều kiện toán học về tính dừng và tính khả nghịch của các mô hình.
  • Suy dẫn và diễn giải được ý nghĩa của Hàm tự tương quan (ACF) và Hàm tự tương quan riêng phần (PACF).
  • Sử dụng thành thạo Stata để vẽ và phân tích biểu đồ ACF/PACF, từ đó nhận dạng mô hình phù hợp cho dữ liệu.

Tài liệu tham khảo chính

  • Box, G.E.P., & Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day.
  • Hamilton, J.D. (1994). Time Series Analysis. Princeton University Press.
  • Yule, G.U. (1927). On the Method of Investigating Periodicities in Disturbed Series with Special Reference to Wolfer’s Sunspot Numbers. Transactions of the Royal Society of London Series A, 226: 267–298.
  • Slutsky, E. (1927). The Summation of Random Causes as the Source of Cyclic Processes. Econometrica, 5: 105–146.

PHỤ LỤC: Dữ liệu mô phỏng cho chuỗi bài viết

Để minh họa các đặc tính của từng loại mô hình, chúng ta sẽ tạo ra các chuỗi dữ liệu mô phỏng tuân theo các quy trình AR(1) và MA(1) điển hình. Việc này giúp chúng ta quan sát hình dạng “lý tưởng” của ACF và PACF trước khi làm việc với dữ liệu thực tế phức tạp hơn.

Stata
* ==================================================
* TẠO DỮ LIỆU MÔ PHỎNG CÁC QUÁ TRÌNH DỪNG
* Mục đích: Minh họa quá trình AR(1) và MA(1)
* Số quan sát: 500
* ==================================================

* Xóa dữ liệu cũ và thiết lập môi trường
clear
set obs 500
set seed 12345

* --- Tạo quá trình AR(1) dừng ---
* y_t = 0.8 * y_{t-1} + e_t
gen e = rnormal()
gen y_ar1 = .
replace y_ar1 = e in 1
forvalues i = 2/500 {
    replace y_ar1 = 0.8 * y_ar1[`i'-1] + e[`i']
}

* --- Tạo quá trình MA(1) ---
* y_t = e_t + 0.7 * e_{t-1}
gen y_ma1 = e + 0.7 * L.e

* Đặt tên và nhãn cho các biến
label var y_ar1 "Simulated Stationary AR(1) Process (phi=0.8)"
label var y_ma1 "Simulated MA(1) Process (theta=0.7)"

* Lưu dữ liệu để sử dụng
compress
save "simulated_stationary_ts.dta", replace

Mô tả các biến trong dữ liệu

  • y_ar1: Một chuỗi thời gian dừng tuân theo quá trình tự hồi quy bậc 1 với hệ số 0.8. Chúng ta kỳ vọng ACF của nó sẽ giảm dần theo hàm mũ.
  • y_ma1: Một chuỗi thời gian tuân theo quá trình trung bình trượt bậc 1 với hệ số 0.7. Chúng ta kỳ vọng ACF của nó sẽ bị cắt đứt đột ngột sau độ trễ 1.
  • e: Một chuỗi nhiễu trắng (sai số ngẫu nhiên) được dùng để tạo ra hai chuỗi trên.

Bạn có thể tải về bộ dữ liệu đã tạo sẵn ở định dạng .csv để tiện thực hành.

Tải về dữ liệu mô phỏng (.csv)

📚 Bài tiếp theo: Khám phá Quá trình Tự hồi quy (AR) và Điều kiện Dừng

💡 Lưu ý: Hãy đảm bảo đã nắm vững các khái niệm chính trong bài này trước khi tiếp tục.

Back to top button