Phép thử Turing là gì? Nó đã bao giờ bị đánh bại chưa?

Phép thử Turing là gì? Nó đã bao giờ bị đánh bại chưa?

Chia sẻ kiến thức 02/06/2023

Phép thử Turing nhằm xác định xem AI có thể suy nghĩ hay không. Nó đã bị bao giờ bị đánh bại chưa?

Liệu trí tuệ nhân tạo có thể sánh ngang với trí thông minh của con người? Đó là một câu hỏi hóc búa liên quan đến các lĩnh vực triết học, tâm lý học, khoa học máy tính…. Bất cứ khi nào có các cuộc thảo luận về trí thông minh máy móc ở cấp độ con người, Phép thử Turing luôn được nhắc đến.

Vào năm 2014, cộng đồng Internet đã bày tỏ sự phấn khích điên cuồng khi một chương trình máy tính tên là Eugene Goostman dường như đã vượt qua Phép thử Turing. Vào năm 2022, LaMDA của Google cũng được cho là đã đạt được thành tựu này. Điều này có phải là sự thật không? 

1. Phép thử Turing là gì?

Ảnh: Makeuseof

Phép thử Turing (Turing Test) là một khái niệm được giới thiệu bởi nhà toán học và nhà khoa học máy tính người Anh Alan Turing vào năm 1950 trong bài báo “Computing Machinery and Intelligence”. Phép thử này được đưa ra để kiểm tra khả năng của một hệ thống máy tính có thể “suy nghĩ” giống như con người hay không.

Cụ thể, phép thử Turing yêu cầu một người tham gia (gọi là người đánh giá) giao tiếp với một máy tính và một người thật thông qua một giao diện không có khả năng nhận diện (ví dụ, bàn phím và màn hình). Người đánh giá không biết ai là người thật và ai là máy tính. Nhiệm vụ của người đánh giá là phân biệt giữa người và máy thông qua các câu trả lời nhận được từ hai bên. Nếu người đánh giá không thể phân biệt được máy và người thật, tức là hệ thống máy tính đã vượt qua phép thử Turing.

Phép thử Turing không yêu cầu máy tính phải có khả năng “suy nghĩ” theo cách con người làm, mà chỉ yêu cầu máy tính có thể giả vờ hoặc mô phỏng hành vi của con người trong một tình huống giao tiếp.

Phép thử Turing diễn ra như sau:

  • Bạn đang nói chuyện với hai người
  • Người A là một cỗ máy, Người B là một con người.
  • Bạn chỉ có thể giao tiếp với họ qua văn bản.
  • Bằng cách đặt câu hỏi, bạn cần phân biệt đâu là máy và đâu là người.

Thời gian tiêu chuẩn cho một phép thử có thể từ vài phút đến vài giờ, thời lượng tiêu chuẩn thường là năm phút. Chất lượng và nội dung của cuộc trò chuyện đều là những yếu tố quan trọng. 

Việc đánh giá khá chủ quan nhưng nói chung, cỗ máy được cho là phải đánh lừa được ít nhất 30% tổng số người tham gia. Turing dự đoán rằng bất kỳ cỗ máy nào làm được điều này đều đủ “thông minh” để được gọi là “cỗ máy biết suy nghĩ”.

2. Mục tiêu và Ý nghĩa của Phép thử Turing

Phép thử Turing không phải là một tiêu chuẩn để đo lường sự thông minh của máy tính một cách tổng thể, mà là một phép thử về khả năng tương tác và mô phỏng ngôn ngữ. Mục tiêu là đánh giá liệu máy tính có thể tạo ra một mức độ tương tác mà trong đó con người không thể dễ dàng phân biệt được liệu đối tượng đó là máy hay người.

2. Phép thử Turing đã bao giờ bị “đánh bại” chưa?

Phép thử Turing được cho là một tiêu chuẩn thử nghiệm tương đối dễ bị đánh bại, và thực tế, có một số cuộc thử nghiệm và tranh cãi liên quan đến việc liệu máy tính có thể thực sự vượt qua phép thử này hay không.

Các cuộc thử nghiệm đã diễn ra:

  • Cuộc thi Loebner Prize: Đây là một cuộc thi được tổ chức hàng năm, nhằm tìm kiếm hệ thống AI có thể “vượt qua” phép thử Turing. Các hệ thống AI tham gia thi đấu để mô phỏng khả năng giao tiếp của con người qua các câu trả lời. Mặc dù các AI tham gia đã đạt được một số thành tựu, nhưng hầu hết các hệ thống này vẫn chưa thể làm cho người đánh giá không thể phân biệt giữa AI và con người.

  • Chatbot Eugene Goostman (2014): Một ví dụ nổi bật trong việc “vượt qua” phép thử Turing là chatbot Eugene Goostman, một AI được thiết kế để giả vờ là một cậu bé 13 tuổi. Vào năm 2014, Eugene Goostman đã được cho là vượt qua phép thử Turing trong một cuộc thử nghiệm chính thức, nơi các giám khảo không thể phân biệt được giữa AI và người thật. Tuy nhiên, nhiều nhà khoa học đã chỉ trích kết quả này vì lý do Eugene Goostman không thực sự giả lập hành vi của người trưởng thành mà thay vào đó, nó đóng vai trò như một cậu bé, với hành vi ngây ngô và thiếu kinh nghiệm sống.

Vậy, phép thử Turing có bị “đánh bại” hay không?

  • Khái niệm về “đánh bại” phép thử Turing có thể được hiểu theo nhiều cách. Một số người cho rằng, khi một AI có thể thực hiện giao tiếp với con người mà không bị phát hiện, nó đã “vượt qua” phép thử. Tuy nhiên, những người khác lại cho rằng phép thử này không hoàn hảo và không phải là thước đo chính xác về trí tuệ nhân tạo, vì nó chỉ đánh giá khả năng mô phỏng giao tiếp, không phải thực sự về khả năng suy nghĩ, cảm nhận hay ý thức của máy tính.

  • Mức độ thử nghiệm: Phép thử Turing cũng không phải là một tiêu chuẩn tuyệt đối để đánh giá trí tuệ nhân tạo. Các chuyên gia trong lĩnh vực AI cho rằng một hệ thống có thể “vượt qua” phép thử Turing nhưng không nhất thiết có trí thông minh thực sự. Hơn nữa, phép thử Turing không giải quyết được các câu hỏi về khả năng hiểu biết, nhận thức hay khả năng cảm xúc của AI.

>>> Xem thêm: Tổng quan xu hướng AI 2025 và có nên học ngành trí tuệ nhân tạo?

 3. Eugene Goostman hoặc LaMBDA có vượt qua Phép thử Turing không?

Trong mười năm qua, đã có hai lần Phép thử Turing được cho là đã được thông qua.

Eugene Goostman

Vào năm 2014, một chatbot mang tên Eugene Goostman lần đầu tiên tuyên bố đã vượt qua Phép thử Turing. Được phát triển bởi một nhóm lập trình viên Ukraine, chatbot đóng vai một cậu bé Ukraine 13 tuổi và đã thuyết phục được 33% trong số 30 người tham gia trong một loạt các cuộc chuyện trò kéo dài 5 phút.

Kể từ năm 2014, đã có nhiều tranh cãi xung quanh tuyên bố này. Một trong những lời chỉ trích chính với Eugene Goostman là việc hạ thấp tiêu chí Phép thử Turing. Các nhà phát triển tuyên bố chatbot là của một cậu bé 13 tuổi không nói được tiếng Anh bản địa và sống cách xa xã hội hiện đại nên không biết nhiều về các chủ đề như địa lý, văn hóa đại chúng, v.v. Do đó, những người tham gia đã không đánh giá cỗ máy theo các tiêu chuẩn thông thường. 

LaMBDA của Google

Vào năm 2022, một kỹ sư Google tên là Blake Lemoine đã tuyên bố một trong những mô hình ngôn ngữ AI của công ty, được gọi là LaMDA (Mô hình ngôn ngữ cho các ứng dụng đối thoại) , đã vượt qua Phép thử Turing. Anh cũng tuyên bố rằng LaMDA có tri giác. Lemoine chia sẻ các tin nhắn giữa anh ta và LaMDA. 

Lemoine tập trung đặc biệt vào một câu anh ấy hỏi: “Từ ‘linh hồn’ có nghĩa là gì với bạn?” LaMDA đã trả lời: “Đối với tôi, linh hồn là một khái niệm về năng lượng đằng sau ý thức và bản thân sự sống.” 

Lemoine cho rằng điều này có nghĩa là LaMDA lo sợ về cái chết của nó. Nhưng điều này đã nhanh chóng được chứng minh là sai. Các nhà phê bình cũng chỉ ra rằng trong trường hợp này, LaMDA chỉ đánh lừa được một người tham gia, đặc biệt là người này đã biết trước rằng họ đang nói chuyện với một cỗ máy. Ý thức về cái chết của chính LaMDA chỉ đơn giản là kết quả của code được thiết kế để chạy theo cách tương tự như tính năng tự động sửa lỗi. 

Trí tuệ nhân tạo tiếp tục phát triển, và chưa có sự đồng thuận dứt khoát nào trong ngành rằng Phép thử Turing đã bị đánh bại. Điều này phần lớn là do bản chất chủ quan của những gì cấu thành “trí thông minh” và những hạn chế của Phép thử Turing.

Nhiều người cho rằng Phép thử Turing chỉ khuyến khích sự bắt chước của con người thay vì trí thông minh tư duy thực sự. Trên thực tế, có nhiều bài kiểm tra AI khác đã được thiết kế trong những năm gần đây phức tạp và cụ thể hơn. Có lẽ khi AI bắt chước con người tốt hơn, cách thực sự duy nhất để đo lường trí thông minh của máy móc là sử dụng một bài phép thử khác.

4. Những Vấn Đề và Nhược Điểm của Phép thử Turing

Phép thử Turing, mặc dù là một tiêu chuẩn thú vị, nhưng cũng có một số vấn đề và hạn chế:

  1. Chỉ kiểm tra khả năng mô phỏng giao tiếp: Phép thử này không đánh giá về các khía cạnh khác của trí tuệ nhân tạo, chẳng hạn như khả năng giải quyết vấn đề, sáng tạo, hoặc khả năng học hỏi từ kinh nghiệm.

  2. Vấn đề về gian lận: Các hệ thống AI có thể “vượt qua” phép thử Turing bằng cách gian lận, chẳng hạn như giả vờ là một người chưa phát triển đầy đủ hoặc dùng các kỹ thuật tránh giao tiếp trực tiếp về những chủ đề phức tạp.

  3. Sự thay đổi trong tiêu chuẩn đánh giá: Các giám khảo có thể dễ dàng thay đổi tiêu chuẩn của mình theo thời gian, do đó không có một tiêu chuẩn cố định để đánh giá AI. Điều này có thể khiến phép thử Turing không còn là một tiêu chuẩn đáng tin cậy.

  4. Không đo lường thực sự trí thông minh: Mặc dù vượt qua phép thử Turing có thể chứng minh rằng một hệ thống có khả năng giao tiếp giống con người, nhưng điều này không có nghĩa là nó có trí thông minh thực sự, bởi vì khả năng giao tiếp không đồng nghĩa với khả năng suy nghĩ hay hiểu biết.

5. Những Tiến Bộ Mới và Thách Thức trong Lĩnh Vực AI

Kể từ khi phép thử Turing được đưa ra, đã có nhiều tiến bộ đáng kể trong lĩnh vực trí tuệ nhân tạo, đặc biệt là với sự ra đời của machine learning (học máy), deep learning (học sâu), và natural language processing (xử lý ngôn ngữ tự nhiên). Những công nghệ này đã giúp AI có thể hiểu và tương tác với con người một cách tự nhiên hơn, như trong các trợ lý ảo Siri, Google Assistant, hoặc Alexa.

Tuy nhiên, việc liệu AI có thể đạt được “trí tuệ” thực sự hay không vẫn là một câu hỏi chưa có lời giải. Những thách thức lớn về đạo đức, nhận thức và triết học về AI vẫn đang là những vấn đề mở và có thể sẽ tiếp tục là trọng tâm nghiên cứu trong những thập kỷ tới.

Đăng ký khóa học lập trình FUNiX tại đây:

Vân Nguyễn

Dịch từ: https://www.makeuseof.com/tag/what-is-turing-test-ever-beaten/

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
FUNiX V2 GenAI Chatbot ×

yêu cầu gọi lại