Thuật toán học máy hoạt động như thế nào?

Chia sẻ kiến thức 16/02/2022

Các thuật toán học máy được thiết kế để giúp cuộc sống dễ dàng hơn và cải thiện hệ thống, nhưng chúng cũng có thể gây ra nhiều hậu quả xấu. Hãy cùng tìm hiểu.

Table of Contents

Trí tuệ nhân tạo và học máy tạo ra rất nhiều tiến bộ công nghệ. Nhưng làm thế nào để máy móc có khả năng học hỏi? Mặt khác, ứng dụng học máy dẫn đến những hậu quả khôn lường như thế nào?

Đây là phần giải thích nhanh của chúng tôi về cách các thuật toán học máy hoạt động, cùng với một số ví dụ về việc học máy gây ra hậu quả xấu như thế nào.

1. Thuật toán học máy là gì?

Học máy (machine learning) là một nhánh của khoa học máy tính tập trung vào việc cung cấp cho AI khả năng học các nhiệm vụ. Điều này bao gồm việc phát triển các khả năng thực hiện những nhiệm vụ cụ thể mà không cần lập trình viên code AI để thực hiện những nhiệm vụ này. Thay vào đó, AI có thể sử dụng dữ liệu để tự dạy cho mình.

Các lập trình viên làm được điều này thông qua các thuật toán (algorithm) học máy. Các thuật toán này là mô hình dựa trên đó AI “học tập”. Các thuật toán, kết hợp với bộ dữ liệu đào tạo (training dataset), cho phép AI học.

Một thuật toán thường cung cấp một mô hình mà AI có thể sử dụng để giải quyết một vấn đề. Ví dụ, học cách phân biệt hình ảnh của con mèo và con chó. AI áp dụng mô hình mà thuật toán đặt ra cho tập dữ liệu bao gồm hình ảnh của chó và mèo. Theo thời gian, AI sẽ học cách phân biệt mèo và chó chính xác một cách dễ dàng hơn mà không cần sự tham gia của con người.

Học máy mang lại cải tiến cho các công nghệ như công cụ tìm kiếm, thiết bị gia đình thông minh, dịch vụ trực tuyến và máy tự động. Đó là cách Netflix biết bạn có nhiều khả năng sẽ thích những bộ phim nào hơn và cách các dịch vụ phát trực tuyến nhạc có thể đề xuất danh sách phát tiếp theo.

Nhưng mặc dù học máy có thể giúp cuộc sống của chúng ta dễ dàng hơn, chúng cũng có thể đem lại một số hậu quả không mong muốn.

2. 5 ví dụ học máy gây ra sai lầm

2.1 Kết quả sai lầm khi tìm kiếm hình ảnh Google

Thuật toán của Google Tìm kiếm cân nhắc nhiều thứ khi sắp xếp kết quả, chẳng hạn như từ khóa và tỷ lệ thoát (bounce rate). Tuy nhiên, thuật toán này cũng học hỏi từ lưu lượng truy cập của người dùng, điều này có thể ảnh hưởng đến chất lượng kết quả tìm kiếm.

Không ở đâu mà vấn đề này rõ ràng hơn là trong kết quả hình ảnh. Vì các trang web có lưu lượng truy cập cao có nhiều khả năng hiển thị hình ảnh của họ hơn, các câu chuyện thu hút số lượng người dùng cao, bao gồm cả clickbait (nội dung cố ý hứa hẹn quá mức hoặc trình bày sai sự thật, nhằm lôi kéo người dùng vào một trang web), thường được ưu tiên.

Ví dụ: kết quả tìm kiếm hình ảnh cho “khu ổ chuột ở Nam Phi” đã gây ra tranh cãi khi người ta phát hiện ra rằng phần lớn các ảnh này có người Nam Phi da trắng. Điều này đi ngược lại các số liệu thống kê cho thấy phần lớn những người sống trong các khu ổ chuột là người Nam Phi da đen.

Các yếu tố được sử dụng trong thuật toán của Google cũng có nghĩa là người dùng internet có thể thao túng kết quả. Ví dụ: một chiến dịch của người dùng đã ảnh hưởng đến kết quả Tìm kiếm hình ảnh của Google đến mức tìm kiếm cụm từ “đồ ngốc” hiển thị hình ảnh của Tổng thống Hoa Kỳ Donald Trump.

2.2 Các vấn đề về AI nhận dạng khuôn mặt

AI nhận dạng khuôn mặt gây nhiều lo ngại về việc xâm phạm quyền riêng tư. Nhưng AI này cũng gây ra mối lo ngại lớn khi cố gắng nhận dạng người da màu.

Vào năm 2015, người dùng phát hiện ra rằng Google Photos đang phân loại một số người da đen là khỉ đột. Vào năm 2018, nghiên cứu của ACLU cho thấy phần mềm nhận dạng khuôn mặt Rekognition của Amazon đã nhận dạng 28 thành viên Quốc hội Hoa Kỳ là đối tượng tình nghi của cảnh sát, việc nhận dạng sai này ảnh hưởng nhiều hơn đến người da màu.

Một sự cố khác liên quan đến phần mềm Face ID của Apple nhận dạng hai phụ nữ Trung Quốc khác nhau là cùng một người. Kết quả là đồng nghiệp của chủ nhân iPhone X có thể mở khóa điện thoại.

2.3 Deepfake được sử dụng để lừa bịp

Trong khi mọi người từ lâu đã sử dụng Photoshop để tạo ra các hình ảnh lừa bịp, thì học máy đã đưa điều này lên một tầm cao mới. Phần mềm như FaceApp cho phép bạn hoán đổi mặt người từ video này sang video khác.

Tuy nhiên, nhiều người khai thác phần mềm này cho nhiều mục đích xấu, bao gồm ghép khuôn mặt người nổi tiếng vào video khiêu dâm. Trong khi đó, người dùng internet đã giúp cải tiến công nghệ, khiến cho việc phân biệt video thật với video giả ngày càng khó khăn. Kết quả là, loại AI này đã “đóng góp rất tích cực” trong việc phát tán tin tức giả và các trò lừa bịp.

2.4 Sự trỗi dậy của Twitter Bot

Ban đầu, các bot Twitter được tạo ra để tự động hóa những công việc như trả lời khách hàng. Tuy nhiên công nghệ này hiện gây ra rất nhiều lo ngại. Trên thực tế, nghiên cứu đã ước tính rằng có tới 48 triệu người dùng trên Twitter thực sự là bot AI.

Thay vì chỉ đơn giản sử dụng các thuật toán để theo dõi một số hashtag hoặc trả lời các truy vấn của khách hàng, nhiều tài khoản bot cố gắng bắt chước người thật. Những tài khoản này sau đó quảng bá các trò lừa đảo và lan truyền tin tức giả.

Ở một mức độ nhất định, một làn sóng bot Twitter thậm chí còn gây ảnh hưởng đến dư luận về Brexit và cuộc bầu cử tổng thống Mỹ năm 2016. Bản thân Twitter cũng thừa nhận rằng họ đã phát hiện ra khoảng 50.000 bot do Nga sản xuất đã đăng về các cuộc bầu cử.

Những con bot này hiện vẫn tiếp tục lan truyền thông tin sai lệch trên Twitter. Vấn đề phổ biến đến mức nó thậm chí còn ảnh hưởng đến việc định giá của công ty.

2.5 AI của Amazon quyết định tuyển nam giới tốt hơn là nữ giới

Vào tháng 10 năm 2018, Reuters đưa tin rằng Amazon đã phải loại bỏ một công cụ tuyển dụng việc làm sau khi AI của phần mềm quyết định ưu tiên các ứng viên nam.

Theo một số nhân viên giấu tên của Amazon, các nhà phát triển của công cụ này muốn AI xác định những ứng viên tốt nhất cho một công việc dựa trên CV của họ. Tuy nhiên, những người tham gia dự án nhanh chóng nhận thấy rằng AI đã thiên vị các ứng viên nam. Họ giải thích rằng bộ dữ liệu đào tạo của AI này là bộ CV từ thập kỷ trước, hầu hết trong số đó là của nam giới.

Kết quả là AI bắt đầu loại bỏ các CV dựa trên từ khóa “phụ nữ”, ví dụ như các CV có cụm từ “đội trưởng câu lạc bộ cờ vua nữ”. Amazon cuối cùng đã ngừng lại dự án này.

3. Tại sao học máy lại tạo ra sai lầm?

Có hai lý do chính khiến việc học máy dẫn đến những hậu quả không mong muốn: dữ liệu và con người. Về mặt dữ liệu, có thể nói, “rác vào, rác ra”. Nếu dữ liệu được cung cấp cho AI bị hạn chế, sai lệch hoặc chất lượng thấp; thì AI đó sẽ có phạm vi giới hạn hoặc những định kiến nhất định.

Nhưng ngay cả khi dữ liệu chính xác, con người vẫn có thể khiến cho những điều không mong muốn xảy ra. Những người tạo ra phần mềm thường không nhận ra cách mọi người có thể sử dụng công nghệ một cách độc hại hoặc cho những mục đích tư lợi của cá nhân. Ví dụ, Deepfakes xuất phát từ công nghệ được sử dụng để cải thiện các hiệu ứng đặc biệt trong điện ảnh. Một công nghệ vốn nhằm mục đích cung cấp giải trí phong phú hơn đã bị lợi dụng để sẽ hủy hoại cuộc sống của con người.

Dịch từ: https://www.makeuseof.com/tag/machine-learning-algorithms/

>>> Nếu bạn đang có nhu cầu học lập trình trực tuyến, tìm hiểu ngay tại đây:

>>> Xem thêm bài viết:

Đại học trực tuyến? Tại sao nên chọn học đại học trực tuyến thay vì đại học offline?

5 điều có thể bạn chưa biết về học lập trình trực tuyến FUNiX

Review khóa học trực tuyến FUNiX FPT đang được nhiều bạn trẻ lựa chọn

FUNiX đào tạo lập trình trực tuyến cung cấp nhân sự tập đoàn FPT

5 Điểm đáng chú ý tại khóa học lập trình trực tuyến FPT – FUNiX

Vân Nguyễn

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

Chủ động thời gian - không gian học lập trình nhúng (Nguồn: Internet)

Báo cáo Việc làm và mức lương ngành công nghệ thông tin năm 2024

Chi tiết cách lập trình PHP bằng phần mềm Dreamweaver CC (Nguồn ảnh: Internet)

Tự học lập trình PHP có khó không? Ưu & Nhược điểm của phương pháp tự học

Lập trình viên PHP là gì? X kiến thức & kỹ năng cần nắm vững để ra nghề nhanh

Trí tuệ nhân tạo phim: Loại hình phim & Cách ứng dụng AI khi làm phim

Góc giải đáp: Có nên học trí tuệ nhân tạo ở FUNiX không?

Trí tuệ nhân tạo học trường nào? Tổng hợp các trường hot nhất hiện nay

Xu hướng học trí tuệ nhân tạo ở Việt Nam: Vì sao ngành này ngày càng hot?

Trí tuệ nhân tạo là gì? Ứng dụng của trí tuệ nhân tạo trong các ngành

Bài liên quan

Báo cáo Việc làm và mức lương ngành công nghệ thông tin năm 2024

Nguyễn Cúc 21/02/2024

Người tìm việc có thể thấy thị trường lao động năm 2024 cạnh tranh hơn, vì các công ty thực hiện sa thải để cắt giảm chi phí, chậm tuyển dụng và đề nghị mức lương thấp. Nhưng một số...

Tự học lập trình PHP có khó không? Ưu & Nhược điểm của phương pháp tự học

administratoir 02/02/2024

Tự học lập trình PHP có khó không là câu hỏi nhiều người thắc mắc, bạn muốn biết phương pháp tự học liệu có hiệu quả, ưu nhược điểm là gì? Câu trả lời có ngay trong bài viết bên...

Lập trình viên PHP là gì? X kiến thức & kỹ năng cần nắm vững để ra nghề nhanh

administratoir 02/02/2024

Lập trình viên PHP là gì? Học lập trình PHP cần có kiến thức, kỹ năng như thế nào để ra nghề nhanh chóng? Bài viết dưới đây sẽ giúp bạn giải đáp chi tiết những thắc mắc trên bằng...

Trí tuệ nhân tạo phim: Loại hình phim & Cách ứng dụng AI khi làm phim

administratoir 02/02/2024

Trí tuệ nhân tạo phim là một trong những ứng dụng thành công nhất của nền công nghiệp AI. Bài viết dưới đây sẽ giới thiệu đến bạn 4 loại hình phim phổ biến, cách ứng dụng và những bộ...

Thuật toán học máy hoạt động như thế nào?

Các thuật toán học máy được thiết kế để giúp cuộc sống dễ dàng hơn và cải thiện hệ thống, nhưng chúng cũng có thể gây ra nhiều hậu quả xấu. Hãy cùng tìm hiểu.

1. Thuật toán học máy là gì?

2. 5 ví dụ học máy gây ra sai lầm