Thao tác nâng cao với tập dữ liệu Advanced dataset manipulation Trở thành kiến trúc sư dữ liệu Chào mừng các bạn đã quay trở lại. Trong các bài học trước, chúng ta đã tập trung vào việc “chăm sóc” từng quan sát và biến riêng lẻ – giống như việc đảm bảo mỗi viên gạch trong một công trình đều hoàn hảo. Tuy nhiên, nghiên cứu thực tế hiếm khi chỉ làm việc với một bộ dữ liệu duy nhất, gọn gàng. Thường thì, chúng ta phải đối mặt với một kịch bản phức tạp hơn nhiều: dữ liệu về các cá nhân nằm trong một tệp, dữ liệu về đặc điểm kinh tế của tỉnh thành họ sinh sống lại nằm ở một tệp khác, và có thể dữ liệu khảo sát của năm nay cần được kết hợp với dữ liệu của các năm trước. Đây là lúc kỹ năng thao tác với toàn bộ tập dữ liệu trở nên vô giá. Trong bài học này, chúng ta sẽ vượt ra ngoài việc chỉnh sửa từng …