Công thức học “Mọi công cụ xử lý dữ liệu” của Hwang
Đối với một Data Analyst, có rất nhiều công cụ hỗ trợ cho mục đích phân tích và xử lý dữ liệu. Nếu chúng ta không có một phương pháp học hiệu quả thì sẽ rất khó khăn trong việc học một công cụ mới.
Với bất kỳ công cụ xử lý dữ liệu nào, tôi chia nó ra làm 4 chức năng chính:
- Input: Thu thập dữ liệu cần thiết cho việc làm báo cáo hoặc phân tích
- Filter: Lọc dữ liệu không cần thiết ra khỏi bộ dữ liệu đã lấy
- Transform: Biến đổi chúng thành dữ liệu sẵn sàng cho việc phân tích
- Output: Thực hiện làm báo cáo hoặc phân tích

Tôi đã sử dụng phương pháp học theo nhóm chức năng dưới đây để học bất kỳ công cụ xử lý dữ liệu nào. Và khi chuyển sang công cụ khác nhiệm vụ của tôi là tìm hiểu các chức năng tương ứng của công cụ này đang được hoạt động như nào.
Ví dụ đối với Excel: Khi sếp yêu cầu bạn làm báo cáo kinh doanh trong khoảng thời gian trong năm 2023.
- Input data: Trước khi có những kỹ thuật xử lý cao siêu, những báo cáo đẹp mắt thì giai đoạn đầu tiên bạn cần làm đó là Mở được file Excel - Đây chính là input dữ liệu.
- Filter data: Sau khi đã mở được file Excel, nhiệm vụ của chúng ta phải kiểm tra xem dữ liệu mở có thừa hay thiếu hay không? Nếu yêu cầu dữ liệu trong phạm vi năm 2023 mà file chúng ta mở ra có rất nhiều từ 2021 thì chúng ta cần phải loại chúng đi - Đây là filter hay lọc dữ liệu.
- Transform data: Khi dữ liệu đã được lọc, bước tiếp theo chúng ta cần phải biến đổi dữ liệu thành kết quả đầu ra như yêu cầu. Tại đây chúng ta sử dụng rất nhiều phương pháp biến đổi phức tạp bằng các hàm của Excel
- Output: Thực hiện triển khai làm báo cáo
Đối với SQL tôi sẽ hướng dẫn bạn theo đúng phương pháp này, bạn sẽ không còn bỡ ngỡ hoặc lạc lối trong vấn đề học tập