Skip to content

Latest commit

 

History

History
11 lines (11 loc) · 986 Bytes

README.md

File metadata and controls

11 lines (11 loc) · 986 Bytes

BÀI TẬP

Sử dụng Pandas và Seaborn thực hiện phân tích EDA cho dữ liệu bán hàng (supermarket_sales_vn.csv)

  • Đơn biến (phân tích trên 1 cột):
    • Số đơn: so sánh tổng đơn theo chi nhánh, nhóm hàng, giới tính khách hàng, phương thức thanh toán (cột Payment).
    • Mỗi đơn hàng có một số mặt hàng, vẽ phân bố số lượng đơn theo số mặt hàng (chẳng hạn các đơn hàng có 1, 2, 3, ... mặt hàng có số đơn là bao nhiêu?).
    • Thời gian: ngày nào bận rộn nhất tuần? thời điểm nào bận rộn nhất trong ngày?
  • Đa biến (cần kết hợp 2 hay nhiều cột):
    • Doanh thu: tỷ lệ tổng doanh thu theo chi nhánh, nhóm hàng, giới tính khách hàng.
    • Thuế: tương tự doanh thu.
    • Rating: so sánh rating giữa các nhóm hàng, giữa các ngày trong tuần, giới tính.
    • Xem xét mối tương quan giữa các biến dạng số.