

Đinh Hoàng Phuơng Anh
Giới thiệu về bản thân



































Khoa học dữ liệu quan trọng vì nó giúp phân tích dữ liệu lớn để đưa ra quyết định chính xác, nhanh và có cơ sở, từ đó tăng hiệu quả, giảm chi phí và cải thiện trải nghiệm người dùng.
Ví dụ minh họa:
Y tế: Dùng mô hình học máy để dự đoán bệnh sớm từ dữ liệu khám bệnh, giúp bác sĩ điều trị kịp thời.
Tài chính: Phát hiện gian lận thẻ tín dụng dựa vào hành vi giao dịch bất thường.
Thương mại điện tử: Gợi ý sản phẩm phù hợp dựa trên lịch sử mua sắm, tăng doanh thu.
Giao thông: Phân tích dữ liệu di chuyển để tối ưu hóa đèn tín hiệu hoặc tuyến xe buýt.
Quy trình dùng học máy để phân nhóm khách hàng gồm:
1. Thu thập dữ liệu: Giới tính, tuổi, thu nhập, sở thích, hành vi mua sắm…
2. Tiền xử lý: Làm sạch, mã hóa, chuẩn hóa dữ liệu.
3. Trích xuất đặc trưng: Tổng chi tiêu, tần suất mua, loại hàng yêu thích…
4. Chọn mô hình:
Nếu không có nhãn: dùng phân cụm (K-Means).
Nếu có nhãn: dùng phân loại (Random Forest, SVM).
Quy trình dùng học máy để phân nhóm khách hàng gồm:
1. Thu thập dữ liệu: Giới tính, tuổi, thu nhập, sở thích, hành vi mua sắm…
2. Tiền xử lý: Làm sạch, mã hóa, chuẩn hóa dữ liệu.
3. Trích xuất đặc trưng: Tổng chi tiêu, tần suất mua, loại hàng yêu thích…
4. Chọn mô hình:
Nếu không có nhãn: dùng phân cụm (K-Means).
Nếu có nhãn: dùng phân loại (Random Forest, SVM).