Xử lý ngôn ngữ tự nhiên là gì?
Xử lý ngôn ngữ tự nhiên (Natural Language Processing) là gì? Những điểm cơ bản bạn cần biết về Xử lý ngôn ngữ tự nhiên
Table of Contents
1. Xử lý ngôn ngữ tự nhiên (NLP) là gì?
Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) là một nhánh của lĩnh vực trí tuệ nhân tạo (AI), cho phép máy tính phân tích và hiểu ngôn ngữ của con người, cả ngôn ngữ viết và nói. Nó giúp xây dựng những phần mềm có khả năng tạo ra và hiểu các ngôn ngữ tự nhiên, qua đó cho phép người dùng có thể trò chuyện trực tiếp với máy tính thay vì phải thông qua các ngôn ngữ lập trình như Java hoặc C.
2. Hiểu về xử lý ngôn ngữ tự nhiên (NLP)
Xử lý ngôn ngữ tự nhiên (NLP) là một phần trong một nỗ lực của giới công nghệ nhằm dùng trí tuệ nhân tạo (AI) để đơn giản hóa cách thức hoạt động của thế giới.
Thông qua AI, các lĩnh vực như học máy (machine learning) và học sâu (deep learning) đang mở ra vô vàn cơ hội cho thế giới. Học máy đang ngày càng được sử dụng nhiều hơn trong lĩnh vực phân tích dữ liệu nhằm hiểu biết về dữ liệu lớn (big data). Nó cũng được sử dụng để lập trình ra các chatbot nhằm mô phỏng các cuộc trò chuyện với khách hàng. Tuy nhiên, những ứng dụng này của học máy sẽ không thể thực hiện được nếu không có Xử lý ngôn ngữ tự nhiên (NLP).
3. Các giai đoạn trong Xử lý ngôn ngữ tự nhiên (NLP)
NLP kết hợp AI với ngôn ngữ học máy tính (computational linguistics) và khoa học máy tính để xử lý ngôn ngữ của con người. Quá trình này có thể được chia thành ba giai đoạn. Nhiệm vụ đầu tiên của NLP là hiểu được ngôn ngữ tự nhiên mà máy tính nhận được. Máy tính sử dụng một mô hình thống kê để thực hiện một quy trình nhận dạng giọng. Quy trình này chuyển đổi ngôn ngữ tự nhiên sang ngôn ngữ lập trình bằng cách chia nhỏ đoạn nói mà nó nghe được thành các đơn vị nhỏ, và sau đó so sánh các đơn vị này với các đơn vị của từ một đoạn nói trước đó.
Đầu ra hoặc kết quả ở định dạng văn bản xác định xem từ và câu nào có nhiều khả năng vừa được nói nhất. Nhiệm vụ này được gọi là quá trình chuyển lời nói thành văn bản (speech-to-text process).
Nhiệm vụ tiếp theo được gọi là Gán nhãn từ loại (part-of-speech tagging). Quá trình này nhận dạng các từ thành danh từ, động từ, tính từ, thì quá khứ, v.v. bằng cách sử dụng một bộ quy tắc từ vựng được mã hóa trong máy tính. Sau hai giai đoạn này, máy tính có thể hiểu được ý nghĩa của đoạn nói mà nó vừa nghe.
Bước thứ ba được thực hiện bởi NLP là chuyển đổi văn bản thành giọng nói. Ở giai đoạn này, ngôn ngữ lập trình máy tính được chuyển đổi thành định dạng văn bản hoặc âm thanh cho người dùng. Ví dụ: một chatbot về tin tức tài chính, khi được hỏi “Hôm nay Google thế nào?” rất có thể sẽ quét các trang web tài chính trực tuyến để tìm cổ phiếu của Google và có thể quyết định chỉ chọn lựa những thông tin như giá và lượng giao dịch để làm câu trả lời.
Tuy lĩnh vực NLP đã đạt được một số thành tựu nhất định, nhưng do các từ có thể được sử dụng trong các ngữ cảnh khác nhau và máy móc không có trải nghiệm thực tế của con người để truyền tải và mô tả các thực thể bằng lời, nên có lẽ sẽ mất một thời gian nữa trước khi thế giới có thể không cần đến ngôn ngữ lập trình.
>>> Nếu bạn đang có nhu cầu học lập trình trực tuyến, tìm hiểu ngay tại đây:
>>> Xem thêm bài viết:
Đại học trực tuyến? Tại sao nên chọn học đại học trực tuyến thay vì đại học offline?
5 điều có thể bạn chưa biết về học lập trình trực tuyến FUNiX
Review khóa học trực tuyến FUNiX FPT đang được nhiều bạn trẻ lựa chọn
FUNiX đào tạo lập trình trực tuyến cung cấp nhân sự tập đoàn FPT
5 Điểm đáng chú ý tại khóa học lập trình trực tuyến FPT – FUNiX
Vân Nguyễn (Dịch từ Investopedia)
Bình luận (0
)