Skip to content

Latest commit

 

History

History
11 lines (11 loc) · 786 Bytes

README.md

File metadata and controls

11 lines (11 loc) · 786 Bytes

BÀI TẬP

Cơ Bản

Thực hiện phân tích mô tả cho dữ liệu chuyến bay 'nycflights.csv':

  1. Cho cột dep_delay (khởi hành trễ).
  2. Cho cột arr_delay (đến nơi trễ).
  3. Cho cột distance (khoảng cách chuyến bay).
  4. Sử dụng linear regression xây dựng mô hình dự đoán thời gian đến nơi trễ (arr_delay) dựa vào thời gian xuất phát trễ (dep_delay) và khoảng cách (distance).

Nâng Cao

Tiếp tục với dữ liệu 'nycflights.csv':

  1. Thực hiện phân tích mô tả cho 3 cột ở trên nhưng chia theo nơi xuất phát: cột origin (gồm 3 sân bay: JFK, LGA, EWR).
  2. Chia ra làm 3 mô hình cho 3 sân bay xuất phát (JFK, LGA, EWR) và nhận xét về độ chính xác so với mô hình chung.