Tổng quan về các phương pháp phân tích tổng hợp nâng cao

An Overview of Further Methods for Meta-Analysis

Chào mừng các bạn đến với một chuỗi bài học mới, nơi chúng ta sẽ cùng nhau khám phá những chân trời khác của thế giới phân tích tổng hợp. Trong suốt các bài học trước, chúng ta đã tập trung vào một phương pháp tiếp cận rất mạnh mẽ và phổ biến: phân tích tổng hợp dựa trên kích thước hiệu ứng. Quy trình này bao gồm việc tính toán một kích thước hiệu ứng (ví dụ: Hedges’ g hoặc Log Odds Ratio) và phương sai của nó từ mỗi nghiên cứu, sau đó kết hợp chúng lại bằng cách sử dụng trung bình có trọng số, với trọng số là nghịch đảo của phương sai. Đây được xem là “tiêu chuẩn vàng” trong hầu hết các lĩnh vực vì nó trả lời câu hỏi quan trọng nhất: “Mức độ của hiệu ứng là bao nhiêu?”.

Tuy nhiên, trong một số tình huống đặc biệt, phương pháp này có thể không thực hiện được hoặc không phải là cách tiếp cận phù hợp nhất. Điều gì sẽ xảy ra nếu một số nghiên cứu cũ chỉ báo cáo giá trị p mà không cung cấp đủ thông tin để tính toán kích thước hiệu ứng? Hoặc khi chúng ta làm việc với dữ liệu nhị phân và muốn sử dụng các phương pháp truyền thống đã được kiểm chứng trong lĩnh vực dịch tễ học? Hay một câu hỏi sâu hơn, liệu chúng ta có thể hiệu chỉnh kết quả của các nghiên cứu để loại bỏ những sai sót do phương pháp luận gây ra không? Chuỗi bài học này sẽ giới thiệu một số phương pháp thay thế để giải quyết chính những vấn đề đó. Chúng ta sẽ tìm hiểu về các kỹ thuật dựa trên việc kết hợp giá trị p, các phương pháp kinh điển như Mantel-Haenszel, và một trường phái hấp dẫn là Phân tích tổng hợp Tâm lý trắc học. Việc nắm vững các phương pháp này sẽ không chỉ làm phong phú thêm bộ công cụ phân tích của bạn mà còn giúp bạn có một cái nhìn sâu sắc và toàn diện hơn về lịch sử và sự đa dạng của lĩnh vực phân tích tổng hợp.

Cấu trúc chuỗi bài học về các phương pháp nâng cao

Để giúp các bạn dễ dàng tiếp cận các phương pháp có phần khác biệt này, chúng ta sẽ đi qua từng chủ đề một cách có hệ thống. Mỗi bài viết sẽ tập trung vào một nhóm phương pháp cụ thể, giải thích logic, ưu nhược điểm và bối cảnh ứng dụng của chúng.

Phân tích tổng hợp dựa trên giá trị p và chiều hướng hiệu ứng
Khám phá các kỹ thuật để tổng hợp kết quả khi thông tin về độ lớn hiệu ứng bị hạn chế, tập trung vào câu hỏi “Liệu có tồn tại hiệu ứng hay không?”.
Các phương pháp nâng cao cho dữ liệu nhị phân
Tìm hiểu hai phương pháp kinh điển là Mantel-Haenszel và Peto, những lựa chọn thay thế quan trọng cho phương pháp nghịch đảo phương sai khi xử lý bảng 2×2.
Giới thiệu về phân tích tổng hợp tâm lý trắc học
Bước vào một trường phái mới, nơi chúng ta học cách hiệu chỉnh các kích thước hiệu ứng để loại bỏ sai lệch gây ra bởi các sai sót hệ thống trong nghiên cứu.
Bài tổng hợp: Hệ thống hóa và lựa chọn phương pháp phù hợp
Cung cấp một cái nhìn tổng quan, so sánh các phương pháp đã học với phương pháp nghịch đảo phương sai tiêu chuẩn và đưa ra hướng dẫn để lựa chọn công cụ phù hợp.

Kiến thức tiên quyết cần chuẩn bị

Để hiểu rõ các phương pháp nâng cao này, đặc biệt là để thấy được sự khác biệt của chúng, các bạn cần có một nền tảng rất vững chắc về phương pháp phân tích tổng hợp tiêu chuẩn.

Thành thạo Phân tích tổng hợp nghịch đảo phương sai: Bạn cần phải hiểu rất rõ logic của phương pháp phân tích tổng hợp dựa trên kích thước hiệu ứng và trọng số là nghịch đảo phương sai.

Hiểu sâu về các khái niệm thống kê: Nắm vững ý nghĩa của giá trị p (p-value), tỷ lệ chênh (odds ratio), và hệ số tương quan (correlation).

Tư duy phản biện về phương pháp luận nghiên cứu: Có khả năng nhận biết các nguồn sai sót tiềm tàng trong một nghiên cứu, chẳng hạn như sai số đo lường hoặc các hạn chế về mẫu, là điều cần thiết để hiểu được logic của phân tích tổng hợp tâm lý trắc học.

Mục tiêu học tập của chuỗi bài viết

Kết thúc chuỗi bài học này, bạn sẽ có một bộ công cụ phân tích đa dạng hơn, cho phép bạn xử lý được nhiều loại dữ liệu và câu hỏi nghiên cứu hơn. Cụ thể, bạn sẽ có thể:

Lựa chọn phương pháp phù hợp: Nhận biết được các tình huống mà các phương pháp thay thế (kết hợp p-value, Mantel-Haenszel, Peto) có thể phù hợp hơn phương pháp tiêu chuẩn.
Thực hiện các phân tích thay thế: Sử dụng Stata để thực hiện các phương pháp Mantel-Haenszel và Peto, cũng như viết mã tùy chỉnh để áp dụng các phương pháp kết hợp giá trị p.
Hiểu được logic của hiệu chỉnh sai sót: Nắm bắt được nguyên tắc cơ bản của phân tích tổng hợp tâm lý trắc học và tại sao việc hiệu chỉnh cho các sai sót hệ thống lại quan trọng.
Diễn giải kết quả một cách cẩn trọng: Hiểu rõ những hạn chế và các loại giả thuyết không mà mỗi phương pháp đang kiểm định để diễn giải kết quả một cách chính xác.

Tài liệu tham khảo chính

Nội dung của chuỗi bài viết này được phát triển dựa trên tài liệu tham khảo gốc dưới đây, kết hợp với các ví dụ và mã lệnh Stata được xây dựng riêng để phục vụ mục đích giảng dạy.

Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R. (2021). Introduction to Meta-Analysis (Second Edition). John Wiley & Sons Ltd. (Cụ thể là Phần 10: Further Methods, bao gồm các chương 40-43).

Phụ lục: Dữ liệu mô phỏng cho chuỗi bài viết

Để minh họa cho các phương pháp đa dạng này, chúng ta sẽ tạo một bộ dữ liệu mô phỏng. Bộ dữ liệu này chứa thông tin từ 6 nghiên cứu đánh giá hiệu quả của một chương trình đào tạo việc làm.

Các bạn hãy chạy đoạn mã Stata dưới đây để tạo ra tệp dữ liệu further_methods_data.dta.

Stata

* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho chuỗi bài học về các phương pháp nâng cao
* TÊN FILE: further_methods_data.dta
* ==================================================

clear
set obs 6

* --- BIẾN ĐỊNH DANH ---
gen study_id = _n

* --- DỮ LIỆU CHO PHƯƠNG PHÁP M-H VÀ PETO (Bảng 2x2) ---
* a: có việc (nhóm can thiệp), b: thất nghiệp (nhóm can thiệp)
* c: có việc (nhóm đối chứng), d: thất nghiệp (nhóm đối chứng)
gen a = round(runiform(20, 50))
gen b = round(runiform(30, 60))
gen c = round(runiform(15, 40))
gen d = round(runiform(40, 70))

* --- DỮ LIỆU CHO PHƯƠNG PHÁP KẾT HỢP P-VALUE ---
* Chúng ta sẽ tính ES và SE từ dữ liệu 2x2 ở trên để có Z và p-value
* Tính log odds ratio (lor) và phương sai của nó (varlor)
gen lor = log((a*d)/(b*c))
gen varlor = 1/a + 1/b + 1/c + 1/d
gen selor = sqrt(varlor)
* Tính Z-score và p-value hai phía
gen z_score = lor / selor
gen p_value = 2 * (1 - normal(abs(z_score)))

* --- DỮ LIỆU CHO PHÂN TÍCH TỔNG HỢP TÂM LÝ TRẮC HỌC ---
* Giả sử các nghiên cứu này cũng đo lường mối tương quan giữa kỹ năng
* sau đào tạo và mức lương.
gen n = a + b + c + d  // Tổng kích thước mẫu
gen r_obs = runiform(0.15, 0.45) // Tương quan quan sát được
gen reliability = runiform(0.7, 0.95) // Độ tin cậy của thang đo lương

* Gán nhãn
label var study_id "Mã nghiên cứu"
label var a "Có việc (Can thiệp)"
label var c "Có việc (Đối chứng)"
label var lor "Log Odds Ratio"
label var p_value "P-value hai phía"
label var n "Kích thước mẫu"
label var r_obs "Tương quan quan sát được"
label var reliability "Độ tin cậy của thang đo"

* Lưu dữ liệu
save "further_methods_data.dta", replace

* Xem lại dữ liệu
list study_id a b c d lor p_value n r_obs reliability, format(%9.3f)

* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho chuỗi bài học về các phương pháp nâng cao
* TÊN FILE: further_methods_data.dta
* ==================================================

clear
set obs 6

* --- BIẾN ĐỊNH DANH ---
gen study_id = _n

* --- DỮ LIỆU CHO PHƯƠNG PHÁP M-H VÀ PETO (Bảng 2x2) ---
* a: có việc (nhóm can thiệp), b: thất nghiệp (nhóm can thiệp)
* c: có việc (nhóm đối chứng), d: thất nghiệp (nhóm đối chứng)
gen a = round(runiform(20, 50))
gen b = round(runiform(30, 60))
gen c = round(runiform(15, 40))
gen d = round(runiform(40, 70))

* --- DỮ LIỆU CHO PHƯƠNG PHÁP KẾT HỢP P-VALUE ---
* Chúng ta sẽ tính ES và SE từ dữ liệu 2x2 ở trên để có Z và p-value
* Tính log odds ratio (lor) và phương sai của nó (varlor)
gen lor = log((a*d)/(b*c))
gen varlor = 1/a + 1/b + 1/c + 1/d
gen selor = sqrt(varlor)
* Tính Z-score và p-value hai phía
gen z_score = lor / selor
gen p_value = 2 * (1 - normal(abs(z_score)))

* --- DỮ LIỆU CHO PHÂN TÍCH TỔNG HỢP TÂM LÝ TRẮC HỌC ---
* Giả sử các nghiên cứu này cũng đo lường mối tương quan giữa kỹ năng
* sau đào tạo và mức lương.
gen n = a + b + c + d  // Tổng kích thước mẫu
gen r_obs = runiform(0.15, 0.45) // Tương quan quan sát được
gen reliability = runiform(0.7, 0.95) // Độ tin cậy của thang đo lương

* Gán nhãn
label var study_id "Mã nghiên cứu"
label var a "Có việc (Can thiệp)"
label var c "Có việc (Đối chứng)"
label var lor "Log Odds Ratio"
label var p_value "P-value hai phía"
label var n "Kích thước mẫu"
label var r_obs "Tương quan quan sát được"
label var reliability "Độ tin cậy của thang đo"

* Lưu dữ liệu
save "further_methods_data.dta", replace

* Xem lại dữ liệu
list study_id a b c d lor p_value n r_obs reliability, format(%9.3f)

Diễn giải dữ liệu:
Bộ dữ liệu further_methods_data.dta chứa thông tin từ 6 nghiên cứu, được thiết kế để phục vụ cho các mục đích khác nhau:
Các cột a, b, c, d: Cung cấp dữ liệu thô dạng bảng 2×2, là đầu vào cần thiết cho các phương pháp Mantel-Haenszel và Peto.
Cột p_value: Cung cấp giá trị p cho mỗi nghiên cứu, là đầu vào cho các phương pháp kết hợp p-value.
Các cột n, r_obs, reliability: Cung cấp kích thước mẫu, tương quan quan sát được, và độ tin cậy của phép đo. Đây là những thông tin cần thiết cho Phân tích tổng hợp Tâm lý trắc học.
Bộ dữ liệu đa năng này sẽ cho phép chúng ta thực hành tất cả các kỹ thuật sẽ được giới thiệu trong chuỗi bài học.

📚 Bài tiếp theo: Các phương pháp dựa trên giá trị p và chiều hướng hiệu ứng

💡 Lưu ý: Hãy đảm bảo bạn đã chạy mã Stata trên để tạo bộ dữ liệu. Việc làm quen với các loại thông tin khác nhau trong tệp dữ liệu này sẽ giúp bạn dễ dàng theo dõi các bài học tiếp theo.