FUNiX ra mắt môn Dữ liệu lớn (Big Data), học viên cần làm gì để học tập hiệu quả?
Được thiết kế bởi TS. Đặng Quang Vinh - Tiến sĩ Khoa học máy tính Universite de Lorraine, Pháp. Head of Data Science, Vin Group, môn học giúp học viên tìm hiểu về hệ thống tính toán và thuật toán xử lý dữ liệu để có đầy đủ kiến thức cho những công việc liên quan đến dữ liệu lớn (big data).
- Xu hướng chọn học gia sư trực tuyến của phụ huynh Việt
- Review 5 khóa học lập trình cho người mới bắt đầu tốt nhất
- Có nên chọn khóa học lập trình online miễn phí không? Gợi ý các trang web học lập trình miễn phí
- Review tổ chức giáo dục trực tuyến FUNiX năm 2024 cho các bạn chưa biết
- Review cách học của công ty cổ phần đào tạo trực tuyến unica
Table of Contents
Big Data (dữ liệu lớn) – một trong những xương sống của cuộc Cách mạng 4.0, được định nghĩa như sau: Dữ liệu lớn là những tập dữ liệu lớn hơn, phức tạp hơn, được tập hợp từ những nguồn dữ liệu mới. Các tập dữ liệu này quá lớn đến mức những phần mềm xử lý dữ liệu truyền thống không thể quản lý được. Tuy nhiên, những khối lượng dữ liệu khổng lồ này lại mang nhiều giá trị, có tác dụng to lớn trong giải quyết các vấn đề kinh doanh và quản lý xã hội mà trước đây chúng ta khó thực hiện được.
Tuy nhiên, để khai thác được những giá trị mà dữ liệu lớn mang lại, chúng ta phải đối mặt với nhiều thách thức. Trước hết, đó là độ lớn của dữ liệu ngày càng tăng và tốc độ sản sinh dữ liệu liên tục, đòi hỏi phải có một hệ thống tính toán mạnh mẽ và tối ưu. Bên cạnh đó, dữ liệu cũng rất đa dạng và không phải lúc nào cũng tuyệt đối chính xác, do đó, cần thêm các thuật toán thông minh để thực sự tạo ra giá trị từ big data.
Môn học Dữ liệu lớn sẽ giúp các bạn bước đầu giải quyết những thách thức này.
Nội dung môn học
Trong môn học này học viên sẽ được tìm hiểu về hệ thống tính toán và thuật toán xử lý dữ liệu để có đầy đủ kiến thức cho những công việc liên quan đến dữ liệu lớn. Về hệ thống tính toán, học viên sẽ tìm hiểu qua về Hadoop và đi sâu vào Apache Spark – hai nền tảng phổ biến nhất hiện nay trong xử lý dữ liệu lớn. Các bạn sẽ nắm được tổng quan về nền tảng xử lý dữ liệu lớn thông qua hệ thống các máy tính kết nối với nhau. Về các thuật toán thông minh, học viên sẽ tìm hiểu về các thuật toán học máy cơ bản trong Spark. Những thuật toán này có thể giúp các bạn xây dựng được những ứng dụng đang phổ biến hiện nay. Bên cạnh đó các bạn học viên sẽ được thực hành phát triển một số ứng dụng dựa trên kiến thức đã học.
Cấu trúc môn học
Môn học sẽ có 3 học phần với 16 bài học. Trong phần 1, học viên sẽ được làm quen với Dữ liệu lớn (Big Data), từ nền kiến thức này, có thể tiến tới phần 2 – Giới thiệu về Spark và phần 3 – Spark cho học máy (machine learning) với Big Data.
Mỗi bài sẽ có một (hoặc vài) đoạn video yêu cầu học viên phải xem kỹ, thực hành theo hướng dẫn và trả lời quiz. Xuyên suốt môn học, các bài Quiz và Lab sẽ giúp các bạn tăng cường việc ghi nhớ và vận dụng lý thuyết đã học vào các bài toán thực tế. Ở mỗi phần học, môn học thiết kế các bài tập lớn (Assignment) giúp các bạn có hình dung và trải nghiệm thao tác.
Mục tiêu môn học
Môn học Dữ liệu lớn được thiết kế bởi TS. Đặng Quang Vinh – Tiến sĩ Khoa học máy tính Universite de Lorraine, Pháp. Head of Data Science, Vin Group và hiện đang là giảng viên Đại học Công nghiệp thành phố Hồ Chí Minh. Môn học giúp học viên tìm hiểu về hệ thống tính toán và thuật toán xử lý dữ liệu để có đầy đủ kiến thức cho những công việc liên quan đến dữ liệu lớn. Về hệ thống tính toán, học viên sẽ tìm hiểu qua về Hadoop và đi sâu vào Apache Spark – hai nền tảng phổ biến nhất hiện nay trong xử lý dữ liệu lớn. Các bạn sẽ nắm được tổng quan về nền tảng xử lý dữ liệu lớn thông qua hệ thống các máy tính kết nối với nhau. Sau đó, các bạn sẽ học cách thiết kế, lập lịch và giám sát các đường ống dẫn dữ liệu (data pipelines) thông qua Apache Airflow.
Nguồn học liệu
Để học tập hiệu quả môn học này, học viên cần khai thác triệt để nguồn học liệu từ những nguồn khác nhau, bao gồm cả nguồn online và offline. Tại FUNiX hiện nay đang cung cấp nguồn học liệu MOOC, chắt lọc những video, tài liệu online có giá trị đến từ nền tảng Udemy và Coursera.
Chỉ cần người học thực sự quyết tâm, tự giác xây dựng một lộ trình phù hợp với thời gian của bản thân và thường xuyên tương tác, trao đổi với mentor, học viên sẽ có thể tự tin hoàn thành môn học.
Bình luận (0
)