Các thuật ngữ machine learning học máy phổ biến nhất

Các thuật ngữ machine learning học máy phổ biến nhất

Chia sẻ kiến thức 19/10/2022

Thuật ngữ machine learning là một trong những từ thông dụng của công nghệ hiện nay, thường được sử dụng song song với trí tuệ nhân tạo, Deep Learning và dữ liệu lớn, nhưng thực tế nó có nghĩa là gì?  Và những thuật ngữ học máy nào khác là quan trọng để hiểu?

học máy Machine learning
Các thuật ngữ machine learning học máy phổ biến nhất

1. Thuật ngữ machine learning là gì?

McKinsey đã định nghĩa học máy là “các thuật toán có thể học từ dữ liệu mà không cần dựa vào lập trình dựa trên quy tắc”. Đại học Carnegie Mellon đưa ra điều này: “Lĩnh vực Máy học tìm cách trả lời câu hỏi ‘Làm thế nào chúng ta có thể xây dựng các hệ thống máy tính tự động cải tiến với kinh nghiệm, và các luật cơ bản chi phối tất cả các quá trình học tập là gì?’

Máy học có nghĩa là độ chính xác của hệ thống được cải thiện theo thời gian, với việc bổ sung nhiều dữ liệu và phản hồi hơn. Bạn có thể gặp rất nhiều ví dụ về học máy mỗi ngày mà không nhận ra nó. Khi Facebook đề xuất “những người bạn có thể biết” hoặc khi Amazon gửi email đề xuất cho bạn về các sản phẩm bạn có thể thích dựa trên các lần mua trước đó, họ đang sử dụng các thuật toán máy học để tùy chỉnh kết quả của bạn.

>>> Xem thêm bài viết: Công nghệ AI là gì? Những ứng dụng của công nghệ AI

2. Các thuật ngữ machine learning phổ biến nhất

Ứng dụng của machine learning trong lĩnh vực bán lẻ
Các thuật ngữ machine learning học máy

2.1 Classification

Classification là một thuật ngữ machine learning cốt lõi, là một phần của học có giám sát (học với dữ liệu được gắn nhãn) qua đó dữ liệu đầu vào có thể dễ dàng được tách thành các loại. Trong học máy, có thể có bộ Classification nhị phân chỉ có hai kết quả (ví dụ: spam, không phải spam) hoặc bộ Classification nhiều lớp (ví dụ: loại sách, loài động vật, v.v.).

Một trong những thuật toán Classification phổ biến nhất là cây quyết định (cần thiết cho cả nhà khoa học dữ liệu và kỹ sư học máy), theo đó các câu hỏi lặp đi lặp lại dẫn đến Classification chính xác có thể xây dựng khung “nếu-thì” để thu hẹp nhóm khả năng theo thời gian.

2.2 Clustering

Clustering là một hình thức học tập không giám sát (học với dữ liệu không được gắn nhãn) liên quan đến việc nhóm các điểm dữ liệu theo các tính năng và thuộc tính.

Phân nhóm có thể được sử dụng để tổ chức nhân khẩu học của khách hàng và hành vi mua hàng thành các phân đoạn cụ thể để nhắm mục tiêu và định vị sản phẩm. Nó cũng có thể phân tích chất lượng nhà ở và vị trí địa lý để tạo ra định giá bất động sản và lập kế hoạch bố trí các phát triển thành phố mới. Nó có thể phân loại thông tin theo chủ đề trong thư viện hoặc trang web và biên dịch một thư mục dễ dàng truy cập cho người dùng.

Loại Clustering phổ biến nhất là Clustering K-mean , bao gồm việc biểu diễn mỗi cụm bằng một biến “k” và sau đó xác định trọng tâm của các cụm đó. Tất cả các điểm dữ liệu sau đó được gán cho một cụm cụ thể và thông qua quá trình này, chúng tôi xác định tâm điểm của các cụm mới.

2.3 Regressions – Hồi quy

Các hồi quy tạo ra các mối quan hệ và tương quan giữa các loại dữ liệu khác nhau. Ví dụ: mỗi ảnh hồ sơ có một ảnh với các pixel thuộc về một người. Với dự đoán tĩnh (không thay đổi theo thời gian), máy học thừa nhận rằng một cách sắp xếp pixel nhất định tương ứng với một tên nhất định và cho phép nhận dạng khuôn mặt (ví dụ: khi Facebook đề xuất thẻ cho ảnh bạn vừa tải lên).

Hồi quy cũng có thể hữu ích khi dự đoán kết quả dựa trên dữ liệu ở hiện tại. Trong một thời gian dài, hồi quy thống kê đã được sử dụng để giải quyết các vấn đề, chẳng hạn như dự đoán sự phục hồi của các chức năng nhận thức sau đột quỵ hoặc dự đoán sự rời bỏ của khách hàng trong ngành viễn thông. Sự khác biệt duy nhất là bây giờ nhiều phân tích hồi quy này có thể được thực hiện một cách hiệu quả và nhanh chóng hơn bằng máy móc.

Hồi quy là một loại thuật ngữ machine learning có cấu trúc, nơi chúng ta có thể gắn nhãn các đầu vào và đầu ra. Hồi quy tuyến tính cung cấp kết quả đầu ra với các biến liên tục (bất kỳ giá trị nào trong một phạm vi), chẳng hạn như dữ liệu giá cả. Hồi quy logic là khi các biến phụ thuộc phân loại và các biến được gắn nhãn được xác định chính xác. Ví dụ: bạn có thể phân loại xem một cửa hàng đang mở cửa là (1) hay (0), nhưng chỉ có hai khả năng.

2.4 Deep Learning

Tăng khả năng nhận dạng.
Deep Learning

Deep Learning tương tự như học máy – trên thực tế, nó là một ứng dụng của học máy mô phỏng hoạt động của bộ não con người hơn. Mạng Deep Learning diễn giải dữ liệu lớn (dữ liệu quá lớn không thể chứa vừa trên một máy tính) có cấu trúc và phi cấu trúc và nhận dạng các mẫu. Càng nhiều dữ liệu mà họ có thể “học hỏi”, các quyết định của họ sẽ càng chính xác và đầy đủ. Dưới đây là một số ví dụ về Deep Learning trong thực tế:

Chatbots và trợ lý ảo: Các trợ lý ảo như Alexa và Siri hoặc chatbots dịch vụ khách hàng trên các trang web khác nhau có thể nhận yêu cầu của con người, giải mã ngôn ngữ và đưa ra các phản hồi giống như thật.

Công cụ đề xuất: Từ các trang web du lịch như Booking.com và Expedia đến các nền tảng phát trực tuyến như Netflix và Spotify, công cụ đề xuất học hỏi từ hành vi mua hàng hoặc sử dụng trong quá khứ để tùy chỉnh hoạt động tiếp thị. Có hai hình thức công cụ đề xuất : cộng tác, trong đó dữ liệu sở thích của người dùng được thu thập trên quy mô lớn và người dùng được so sánh với tính cách người dùng tương tự và lọc dựa trên nội dung, trong đó các thuộc tính của các mục cụ thể được phân tích và các mục trong tương lai được so sánh với các mục trong quá khứ để xác định các trận đấu gần nhất.

2.5 Xử lý ngôn ngữ tự nhiên

Thuật ngữ machine learning xử lý ngôn ngữ tự nhiên là trường con của AI xử lý ngôn ngữ của con người. Nó là một thuật ngữ rất quan trọng trong lĩnh vực khoa học dữ liệu và học máy. Thách thức là thường lời nói của con người không theo nghĩa đen. Có những số liệu về giọng nói, từ hoặc ngữ cụ thể cho một số phương ngữ và nền văn hóa nhất định, và các câu có thể mang các ý nghĩa khác nhau với ngữ pháp và dấu câu. Tương tự như các cuộc hội thoại của con người, bộ xử lý ngôn ngữ tự nhiên cần sử dụng cú pháp (sự sắp xếp của các từ) và ngữ nghĩa (ý nghĩa của sự sắp xếp đó) để đưa ra những cách diễn giải chính xác.

Bước đầu tiên trong xử lý ngôn ngữ tự nhiên là chuyển đổi dữ liệu ngôn ngữ phi cấu trúc thành một dạng mà máy tính có thể đọc được. Sau đó, máy tính sẽ gán nghĩa cho từng câu thông qua các thuật toán và dịch ngược lại, thường ở dạng khác (ví dụ: lời nói thành văn bản hoặc từ ngôn ngữ này sang ngôn ngữ khác).

Xử lý ngôn ngữ tự nhiên có thể giúp các ứng dụng dịch như Google Dịch, các công cụ giao tiếp và cộng tác tài liệu như Slack và Microsoft Word cũng như trợ lý ảo. Dưới đây là một ví dụ về cách Ngân hàng Hoàng gia Scotland kết hợp phân tích văn bản để phân tích cú pháp thông qua các khiếu nại dịch vụ khách hàng từ email, khảo sát và trung tâm cuộc gọi để cô lập các khu vực có vấn đề và cải thiện các mối quan hệ và danh tiếng của họ.

2.6 Machine Vision ( Thị giác máy)

Xu hướng học máy machine learning tính đến 2025
Thuật ngữ Machine Vision ( Thị giác máy)

Thị giác máy, hay thị giác máy tính là thuật ngữ machine learning phổ biến mô tả quá trình máy móc có thể chụp và phân tích hình ảnh. Điều này cho phép chẩn đoán ung thư da bằng cách xem tia X và các hình ảnh y tế khác, đồng thời phát hiện giao thông và loại phương tiện trong thời gian thực dành cho ô tô tự lái, như các mẫu xe mới của Tesla .

Có nhiều cách khác nhau mà máy có thể “nhìn thấy”: biểu thị màu sắc bằng số, phân tách hình ảnh thành các phần khác nhau và xác định các góc, cạnh và kết cấu. Khi máy móc thu thập và mã hóa nhiều thông tin hơn, chúng bắt đầu xem bức tranh lớn hơn.

2.7 Kỹ sư học máy

Với tất cả những tiến bộ công nghệ thú vị này, ai là người chịu trách nhiệm triển khai ML trong các công ty? Trong nhiều trường hợp, trách nhiệm đầu tiên thuộc về kỹ sư học máy, một kỹ sư phần mềm hướng dữ liệu tập trung vào việc xây dựng các hệ thống cuối cùng có thể học và thực hiện công việc một cách tự chủ. Những kỹ sư này thường cần phải làm quen với các cơ sở mã khác nhau, tính toán phân tán, xử lý dữ liệu và khoa học máy tính.

>> Xem thêm chuỗi bài viết liên quan:

Machine learning là gì? Những đóng góp của machine learning

Những điều cần biết về học máy Machine learning

Các loại machine learning bạn nên biết

5 Ứng dụng của machine learning quan trọng trong công cuộc chuyển đổi số

Sự khác biệt giữa Khoa học dữ liệu so với học máy

9 Xu hướng học máy hàng đầu tính đến 2025

Tầm quan trọng của trí tuệ nhân tạo trong chuyển đổi số bán hàng

Nguyễn Cúc

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
Chat với FUNiX GPT ×

yêu cầu gọi lại

error: Content is protected !!