Bài học cùng chủ đề
Báo cáo học liệu
Mua học liệu
Mua học liệu:
-
Số dư ví của bạn: 0 coin - 0 Xu
-
Nếu mua học liệu này bạn sẽ bị trừ: 2 coin\Xu
Để nhận Coin\Xu, bạn có thể:
Bài F15. Khoa học dữ liệu SVIP
1. Khái niệm và mục tiêu của Khoa học dữ liệu
a. Khái niệm về Khoa học dữ liệu
Sử dụng công cụ và phương pháp của ba thành phần sau đây để giúp cá nhân, tổ chức hiểu rõ về dữ liệu mình sở hữu và tận dụng tri thức để đưa ra quyết định phù hợp.
- Khoa học máy tính: cung cấp các công cụ và kĩ thuật xử lí, phân tích và khai phá dữ liệu.
- Toán học và thống kê: cung cấp cơ sở cho các phương pháp phân tích và khai phá dữ liệu.
- Tri thức chuyên ngành: là nguồn tri thức của từng lĩnh vực có vai trò quan trọng để hiểu ngữ cảnh và ý nghĩa của dữ liệu nhằm đưa ra quyết định đúng đắn.
b. Mục tiêu của Khoa học dữ liệu
Mục tiêu chính là phân tích và khai phá dữ liệu để có được tri thức, vận dụng tri thức đó để giải quyết vấn đề và đưa ra các quyết định phù hợp.
Một số mục tiêu cụ thể được nêu ngắn gọn như sau:
- Tổ chức và quản lí dữ liệu (nhiệm vụ rất quan trọng) tập trung vào việc xây dựng, duy trì hệ thống tổ chức dữ liệu đảm bảo tính toàn vẹn, sẵn sàng và quản lí hiệu quả các nguồn dữ liệu. Nhằm tạo ra cơ sở hạ tầng dữ liệu mạnh mẽ và linh hoạt, hỗ trợ quá trình phân tích và ra quyết định.
- Phân tích dữ liệu nhằm hiểu rõ về nội dung, cấu trúc dữ liệu, xác định các đặc điểm quan trọng, nhận diện nhóm và xu hướng trong dữ liệu. Giúp tạo ra cái nhìn toàn diện về dữ liệu và hỗ trợ quá trình ra quyết định.
- Trực quan hoá dữ liệu nhằm biểu diễn dữ liệu một cách trực quan, dễ hiểu bằng các sơ đồ, biểu đồ hay hình ảnh, giúp người dùng có được cái nhìn tổng quan về dữ liệu.
Dưới đây là biểu đồ trực quan về lượng mưa và nhiệt độ trung bình của huyện đảo Trường Sa. Dựa vào biểu đồ có thể suy luận ra nhiệt độ và biên độ nhiệt cùng tổng lượng mưa trung bình năm.
- Tối ưu hoá quyết định nhằm cải thiện quyết định dựa trên dữ liệu, bao gồm việc sử dụng các thuật toán tối ưu hoá để đưa ra quyết định tốt nhất dựa trên các ràng buộc và mục tiêu. Ví dụ, tối ưu hoá quy trình sản xuất để tối ưu hoá hiệu quả của dây chuyền sản xuất hay sản lượng, chất lượng sản phẩm,...
- Khám phá tri thức (mục tiêu cao nhất) để tìm ra các mối quan hệ ẩn chứa trong dữ liệu, xác định nguyên nhân và kết quả, tạo ra tri thức mới từ dữ liệu. Ví dụ, trong nghiên cứu dược phẩm, người ta có thể sử dụng dữ liệu bệnh nhân để tìm hiểu mối quan hệ giữa một loại thuốc và các phản ứng phụ, giúp họ hiểu rõ hơn về tác động của loại thuốc này đối với sức khoẻ của bệnh nhân.
Tất cả các mục tiêu cụ thể nêu trên góp phần vào việc tận dụng dữ liệu để đưa ra những quyết định thông minh, cải thiện hoạt động của tổ chức hoặc doanh nghiệp.
2. Một số thành tựu của Khoa học dữ liệu
Khoa học dữ liệu hiện nay gắn với sự phát triển của dữ liệu lớn (loại dữ liệu khó xử lí theo cách thông thường).
Tận dụng một cách hiệu quả dữ liệu lớn khi tự động hoá quy trình (bởi Data Science, AI, Machine Learning) để xử lí, phân tích và khai phá. Việc phân tích và khám phá các tri thức hữu ích từ dữ liệu lớn có thể được coi là thành tựu và lợi ích chung lớn nhất mà Khoa học dữ liệu đem lại.
Dưới đây đề cập khái quát một số thành tựu cụ thể của Khoa học dữ liệu:
- Đổi mới quá trình ra quyết định dựa trên dữ liệu góp phần tăng hiệu quả công việc: Các tổ chức và cá nhân có thể đưa ra những quyết định sáng suốt và chính xác hơn nhờ việc sử dụng dữ liệu để dự báo và phân tích xu hướng phát triển. Khoa học dữ liệu cũng hỗ trợ phân bổ tài nguyên hợp lí và ngăn ngừa hoạt động gian lận trong các tổ chức tài chính.
- Tự động hoá các tác vụ lặp lại giúp con người tập trung vào công việc phức tạp và sáng tạo hơn, nâng cao hiệu quả và độ chính xác trong nhiều lĩnh vực như sản xuất, logistics, dịch vụ khách hàng, và quản lí tài chính. Các công cụ Khoa học dữ liệu ngày càng dễ tiếp cận, cho phép mọi tổ chức vận dụng và thúc đẩy đổi mới sáng tạo và tạo ra nhiều cơ hội mới.
- Cá nhân hoá dịch vụ và cải thiện trải nghiệm khách hàng bằng cách phân tích dữ liệu về nhu cầu và sở thích của họ, giúp doanh nghiệp nâng cao doanh số. Các hệ khuyến nghị giới thiệu sản phẩm dựa trên sở thích cá nhân là giải pháp kinh doanh hiệu quả. Trong y tế, y học cá nhân hoá sử dụng dữ liệu để đưa ra phác đồ điều trị phù hợp, nâng cao hiệu quả chăm sóc sức khoẻ.
Bạn có thể đăng câu hỏi về bài học này ở đây