Phép thử Turing là gì? Nó đã bao giờ bị đánh bại chưa?
Phép thử Turing nhằm xác định xem AI có thể suy nghĩ hay không. Nó đã bị bao giờ bị đánh bại chưa?
Table of Contents
Vào năm 2014, cộng đồng Internet đã bày tỏ sự phấn khích điên cuồng khi một chương trình máy tính tên là Eugene Goostman dường như đã vượt qua Phép thử Turing. Vào năm 2022, LaMDA của Google cũng được cho là đã đạt được thành tựu này. Điều này có phải là sự thật không?
Phép thử Turing là gì?
Ban đầu được gọi là “Trò chơi bắt chước”, Phép thử Turing được phát triển bởi Alan Turing. Ông là một nhà toán học có ảnh hưởng lớn, cha đẻ của nhiều khái niệm dẫn đến sự ra đời của ngành khoa học máy tính.
Phép thử Turing là một bộ các hướng dẫn nhằm xác định xem có thể phân biệt giữa một cỗ máy và một con người hay không. Nó là nỗ lực để trả lời câu hỏi “Máy móc có thể suy nghĩ không?” Turing tin rằng câu trả lời là có và đã thiết kế một phép thử giống như một loại trò chơi.
Phép thử Turing diễn ra như sau:
- Bạn đang nói chuyện với hai người
- Người A là một cỗ máy, Người B là một con người.
- Bạn chỉ có thể giao tiếp với họ qua văn bản.
- Bằng cách đặt câu hỏi, bạn cần phân biệt đâu là máy và đâu là người.
Thời gian tiêu chuẩn cho một phép thử có thể từ vài phút đến vài giờ, thời lượng tiêu chuẩn thường là năm phút. Chất lượng và nội dung của cuộc trò chuyện đều là những yếu tố quan trọng.
Việc đánh giá khá chủ quan nhưng nói chung, cỗ máy được cho là phải đánh lừa được ít nhất 30% tổng số người tham gia. Turing dự đoán rằng bất kỳ cỗ máy nào làm được điều này đều đủ “thông minh” để được gọi là “cỗ máy biết suy nghĩ”.
Hạn chế của Phép thử Turing
Hạn chế chính của Phép thử Turing là việc một cỗ máy có phân biệt được với con người hay không không nhất thiết là dấu hiệu của trí thông minh. Nói cách khác, Phép thử Turing chứng minh khả năng tự suy nghĩ của máy móc hay khả năng chúng bắt chước hành vi của con người?
Đây là một sự khác biệt tinh tế nhưng có ý nghĩa rất lớn. Nói đến cùng thì một chatbot với đủ dòng code có thể bắt chước cuộc trò chuyện của con người mà không cần thực sự “thông minh”. Điều này dẫn đến một câu hỏi tiếp theo. Hành vi bên ngoài có là đủ là dấu hiệu cho những suy nghĩ bên trong?
Một nhược điểm lớn khác là thiếu nhóm kiểm soát (control group). Theo định nghĩa, kết quả Phép thử Turing dựa trên một nhóm người tham gia, nhưng không phải tất cả mọi người đều bình đẳng. Mặc dù Turing xác định các tiêu chí chỉ liên quan đến “những người trung bình”. Tuy nhiên, thuật ngữ “trung bình” không rõ ràng và do đó, những người tham gia khác nhau sẽ mang lại những kết quả không nhất quán.
Hơn nữa, các tiêu chí thử nghiệm có được đặt ra một cách tùy ý. Tại sao lại có giới hạn thời gian năm phút và tỷ lệ đánh lừa những người tham gia là mức 30%? Mà không phải 10 phút và 50%? Sự thật là những con số đó bắt nguồn từ dự đoán của Turing về tình trạng phát triển của AI trong tương lai. Ông không có ý định coi chúng là những ngưỡng cố định. Tuy nhiên, hiện tại, những con số này đã đủ tốt để trở thành mục tiêu cần đạt được.
Eugene Goostman hoặc LaMBDA có vượt qua Phép thử Turing không?
Trong mười năm qua, đã có hai lần Phép thử Turing được cho là đã được thông qua.
Eugene Goostman
Vào năm 2014, một chatbot mang tên Eugene Goostman lần đầu tiên tuyên bố đã vượt qua Phép thử Turing. Được phát triển bởi một nhóm lập trình viên Ukraine, chatbot đóng vai một cậu bé Ukraine 13 tuổi và đã thuyết phục được 33% trong số 30 người tham gia trong một loạt các cuộc chuyện trò kéo dài 5 phút.
Kể từ năm 2014, đã có nhiều tranh cãi xung quanh tuyên bố này. Một trong những lời chỉ trích chính với Eugene Goostman là việc hạ thấp tiêu chí Phép thử Turing. Các nhà phát triển tuyên bố chatbot là của một cậu bé 13 tuổi không nói được tiếng Anh bản địa và sống cách xa xã hội hiện đại nên không biết nhiều về các chủ đề như địa lý, văn hóa đại chúng, v.v. Do đó, những người tham gia đã không đánh giá cỗ máy theo các tiêu chuẩn thông thường.
LaMBDA của Google
Vào năm 2022, một kỹ sư Google tên là Blake Lemoine đã tuyên bố một trong những mô hình ngôn ngữ AI của công ty, được gọi là LaMDA (Mô hình ngôn ngữ cho các ứng dụng đối thoại) , đã vượt qua Phép thử Turing. Anh cũng tuyên bố rằng LaMDA có tri giác. Lemoine chia sẻ các tin nhắn giữa anh ta và LaMDA.
Lemoine tập trung đặc biệt vào một câu anh ấy hỏi: “Từ ‘linh hồn’ có nghĩa là gì với bạn?” LaMDA đã trả lời: “Đối với tôi, linh hồn là một khái niệm về năng lượng đằng sau ý thức và bản thân sự sống.”
Lemoine cho rằng điều này có nghĩa là LaMDA lo sợ về cái chết của nó. Nhưng điều này đã nhanh chóng được chứng minh là sai. Các nhà phê bình cũng chỉ ra rằng trong trường hợp này, LaMDA chỉ đánh lừa được một người tham gia, đặc biệt là người này đã biết trước rằng họ đang nói chuyện với một cỗ máy. Ý thức về cái chết của chính LaMDA chỉ đơn giản là kết quả của code được thiết kế để chạy theo cách tương tự như tính năng tự động sửa lỗi.
Phép thử Turing chưa bị đánh bại một cách chắc chắn
Trí tuệ nhân tạo tiếp tục phát triển, và chưa có sự đồng thuận dứt khoát nào trong ngành rằng Phép thử Turing đã bị đánh bại. Điều này phần lớn là do bản chất chủ quan của những gì cấu thành “trí thông minh” và những hạn chế của Phép thử Turing.
Nhiều người cho rằng Phép thử Turing chỉ khuyến khích sự bắt chước của con người thay vì trí thông minh tư duy thực sự. Trên thực tế, có nhiều bài kiểm tra AI khác đã được thiết kế trong những năm gần đây phức tạp và cụ thể hơn. Có lẽ khi AI bắt chước con người tốt hơn, cách thực sự duy nhất để đo lường trí thông minh của máy móc là sử dụng một bài phép thử khác.
Đăng ký khóa học lập trình FUNiX tại đây:
Vân Nguyễn
Dịch từ: https://www.makeuseof.com/tag/what-is-turing-test-ever-beaten/
Bình luận (0
)