Sự phức tạp của định tuyến động trong mạng Capsule Network

Khám phá sự phức tạp của định tuyến động trong mạng Capsule Network

Chia sẻ kiến thức 04/08/2023

Thuật toán định tuyến động (dynamic routing) cốt lõi của Capsule Network đã chứng tỏ tiềm năng đáng kể trong việc giải quyết một số hạn chế của mạng truyền thống.

Thuật toán định tuyến động (dynamic routing) cốt lõi của Capsule Network đã chứng tỏ tiềm năng đáng kể trong việc giải quyết một số hạn chế của mạng truyền thống.

Trong quá trình xem xét các thuật toán cung cấp năng lượng cho Capsule Network, các nhà nghiên cứu đã nhận ra sự phức tạp của định tuyến động, một kỹ thuật đột phá đang tạo nên làn sóng trong lĩnh vực trí tuệ nhân tạo (AI) và học máy. Capsule Network, được giới thiệu bởi nhà tiên phong về AI Geoffrey Hinton và nhóm của ông vào năm 2017, đã cho thấy nhiều hứa hẹn trong việc giải quyết một số hạn chế của mạng thần kinh tích chập truyền thống (CNN), đặc biệt là về mặt hiểu các mối quan hệ không gian và nhận dạng các đối tượng theo nhiều hướng khác nhau.

Các đặc điểm của định tuyến động trong Capsule Network

Định tuyến động (dynamic routing), cải tiến quan trọng đằng sau Capsule Network, cho phép hệ thống tự động xác định mối quan hệ phân cấp giữa các phần khác nhau của đối tượng. Điều này cho phép các Capsule Network trở nên mạnh mẽ và hiệu quả hơn trong việc xử lý dữ liệu phức tạp, chẳng hạn như hình ảnh với các phối cảnh, góc quay và tỷ lệ khác nhau. Thuật toán định tuyến động về cơ bản hoạt động bằng cách tinh chỉnh lặp đi lặp lại các kết nối giữa các viên nang, là các nhóm nhỏ nơ-ron đại diện cho các tính năng cụ thể của một đối tượng.

capsule network
Capsule Network có thể giải quyết một số hạn chế của mạng truyền thống (ảnh: ts2.space)

Các lớp viên nang đầu vào

Quá trình định tuyến động bắt đầu với lớp viên nang đầu vào, lớp này phát hiện các tính năng cấp thấp trong dữ liệu đầu vào. Sau đó, các viên nang này gửi kết quả đầu ra của chúng, được gọi là “vectơ bỏ phiếu” đến các viên nang cấp cao hơn. Các vectơ biểu quyết đại diện cho sự hiện diện và thuộc tính của các tính năng được phát hiện, chẳng hạn như vị trí, hướng và tỷ lệ của chúng. Sau đó, các viên nang cấp cao hơn sẽ tổng hợp các vectơ biểu quyết này để xác định tổ hợp các tính năng có khả năng nhất tương ứng với một đối tượng nhất quán.

Định tuyến softmax

Để đạt được điều này, thuật toán định tuyến động sử dụng chức năng “định tuyến softmax”, tính toán xác suất mà một viên nang cấp thấp hơn sẽ được kết nối với một viên nang cấp cao hơn. Xác suất này, được gọi là “hệ số ghép nối”, được xác định dựa trên sự giống nhau giữa vectơ biểu quyết và đầu ra hiện tại của viên nang cấp cao hơn. Vectơ biểu quyết càng giống với đầu ra của viên nang cấp cao hơn thì kết nối giữa hai viên nang càng mạnh.

Trong quá trình lặp lại, các hệ số khớp nối được cập nhật dựa trên thỏa thuận giữa vectơ biểu quyết của viên nang cấp thấp hơn và đầu ra của viên nang cấp cao hơn. Điều này cho phép mạng tinh chỉnh dần các kết nối giữa các viên nang, cuối cùng hội tụ về một cấu hình ổn định thể hiện tốt nhất dữ liệu đầu vào. Thuật toán định tuyến động thường chỉ yêu cầu một vài lần lặp lại để đạt được sự hội tụ này, khiến nó trở nên hiệu quả về mặt tính toán và rất phù hợp cho các ứng dụng thời gian thực.

Duy trì mối quan hệ không gian

Một trong những ưu điểm đáng chú ý nhất của Capsule Network và định tuyến động là khả năng duy trì mối quan hệ không gian giữa các tính năng, điều này rất quan trọng đối với các tác vụ như nhận dạng đối tượng và hiểu cảnh. Không giống như CNN thường gặp khó khăn trong việc nhận dạng các đối tượng theo các hướng hoặc tỷ lệ khác nhau, các Capsule Network có thể nắm bắt hiệu quả các vị trí tương đối và sự biến đổi của các tính năng, cho phép chúng khái quát hóa tốt hơn cho các ví dụ mới.

Cải thiện độ bền

Hơn nữa, các Capsule Network đã cho thấy độ bền được cải thiện trước các cuộc tấn công của đối thủ, vốn là những nỗ lực đánh lừa các hệ thống AI bằng cách đưa ra các nhiễu loạn tinh vi trong dữ liệu đầu vào. Khả năng phục hồi tăng lên này có thể là do Capsule Network tập trung vào mối quan hệ giữa các tính năng, thay vì chỉ dựa vào sự hiện diện hay vắng mặt của các tính năng riêng lẻ.

Kết luận

Tóm lại, thuật toán định tuyến động ở cốt lõi của Capsule Network đã chứng tỏ tiềm năng đáng kể trong việc giải quyết một số hạn chế của mạng thần kinh truyền thống. Bằng cách tinh chỉnh lặp đi lặp lại các kết nối giữa các viên nang và duy trì mối quan hệ không gian giữa các tính năng, mạng viên nang có thể đạt được hiệu suất vượt trội trong các tác vụ như nhận dạng đối tượng và hiểu cảnh. Khi nghiên cứu trong lĩnh vực này tiếp tục phát triển, chúng ta có thể mong đợi thấy các hệ thống AI tinh vi hơn tận dụng sức mạnh của định tuyến động và Capsule Network để giải quyết các thách thức ngày càng phức tạp.

Quỳnh Anh (dịch từ Ts2.space: https://ts2.space/en/a-closer-look-at-the-algorithms-powering-capsule-networks/)

Tin liên quan:

 

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
Chat với FUNiX GPT ×

yêu cầu gọi lại

error: Content is protected !!