Xử lý ngôn ngữ tự nhiên (NLP) là một lĩnh vực năng động trong Trí tuệ nhân tạo (AI) và Học máy (ML) chuyên cho phép máy tính hiểu, xử lý, diễn giải và tạo ra ngôn ngữ của con người—cả văn bản và lời nói. Nó kết hợp các nguyên tắc từ ngôn ngữ học tính toán với mô hình thống kê , ML và các mô hình Học sâu (DL) để thu hẹp khoảng cách giữa giao tiếp của con người và khả năng hiểu của máy tính. Mục tiêu cuối cùng là cho phép máy móc tương tác với ngôn ngữ theo cách vừa có ý nghĩa vừa hữu ích, tự động hóa các tác vụ mà theo truyền thống đòi hỏi khả năng ngôn ngữ của con người.
Các khái niệm chính trong NLP
NLP bao gồm một số nhiệm vụ cốt lõi giúp phân tích sự phức tạp của ngôn ngữ thành các thành phần mà máy móc có thể phân tích và xử lý:
- Phân chia thành các mã thông báo : Bước đầu tiên trong việc chia nhỏ văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ hoặc từ phụ (mã thông báo).
- Named Entity Recognition (NER): Identifying and categorizing key entities in text, such as names of people, organizations, locations, dates, and monetary values.
- Phân tích tình cảm : Xác định tông điệu cảm xúc hoặc ý kiến chủ quan được thể hiện trong một đoạn văn bản (ví dụ: tích cực, tiêu cực, trung tính).
- Dịch máy : Tự động dịch văn bản hoặc lời nói từ ngôn ngữ này sang ngôn ngữ khác, như được thấy trong các công cụ như Google Dịch .
- Mô hình hóa ngôn ngữ : Xây dựng các mô hình dự đoán xác suất của một chuỗi từ, rất quan trọng cho các tác vụ như tạo văn bản và nhận dạng giọng nói.
NLP hoạt động như thế nào
Các hệ thống NLP thường sử dụng phương pháp tiếp cận theo đường ống. Dữ liệu văn bản thô đầu tiên trải qua quá trình xử lý dữ liệu trước , bao gồm các tác vụ như làm sạch văn bản (xóa các ký tự hoặc định dạng không liên quan), mã hóa và đôi khi là chuẩn hóa (chuyển đổi từ thành dạng cơ sở). Sau khi xử lý trước, các tính năng có liên quan đến tác vụ được trích xuất. Sau đó, các tính năng này được đưa vào các mô hình ML hoặc DL để phân tích hoặc tạo.
NLP hiện đại phụ thuộc rất nhiều vào Mạng nơ-ron (NN) , đặc biệt là các kiến trúc tinh vi như Mạng nơ-ron hồi quy (RNN) cho dữ liệu tuần tự và gần đây hơn là Transformers . Transformers, được phân biệt bởi các cơ chế chú ý mạnh mẽ của chúng, đã chứng minh được hiệu quả đặc biệt trong việc nắm bắt các phụ thuộc và ngữ cảnh tầm xa trong ngôn ngữ. Kiến trúc này hỗ trợ nhiều mô hình tiên tiến, bao gồm các biến thể của mô hình BERT và GPT như GPT-4 . Các nền tảng nghiên cứu như ACL Anthology lưu trữ nhiều bài báo trình bày chi tiết về những tiến bộ này.
Ứng dụng của NLP
NLP cung cấp năng lượng cho một loạt các ứng dụng đang chuyển đổi các ngành công nghiệp và tăng cường tương tác hàng ngày. Sau đây là hai ví dụ nổi bật:
- Trợ lý ảo và Chatbot : Các hệ thống như Siri của Apple và Amazon Alexa , cùng với vô số chatbot dịch vụ khách hàng, sử dụng NLP rộng rãi. Chúng sử dụng nhận dạng giọng nói để chuyển đổi lời nói thành văn bản, Hiểu ngôn ngữ tự nhiên (NLU) để nắm bắt ý định của người dùng và đôi khi tạo văn bản để xây dựng phản hồi.
- Lọc thư rác email: Các kỹ thuật NLP phân tích nội dung email để xác định các mẫu đặc trưng của thư rác hoặc các nỗ lực lừa đảo. Các thuật toán phân loại email dựa trên từ khóa, danh tiếng của người gửi và cấu trúc ngôn ngữ, giúp giữ cho hộp thư đến sạch sẽ và an toàn.
Các ứng dụng phổ biến khác bao gồm tóm tắt văn bản để cô đọng các tài liệu dài, công cụ tìm kiếm ngữ nghĩa hiểu được ý nghĩa của truy vấn ngoài việc khớp từ khóa đơn giản và các công cụ sửa lỗi ngữ pháp/phong cách như Grammarly . Nhiều trường hợp sử dụng AI sáng tạo phụ thuộc rất nhiều vào NLP.
NLP so với các khái niệm liên quan
Mặc dù có liên quan, NLP khác với một số thuật ngữ tương tự:
- Hiểu ngôn ngữ tự nhiên (NLU) : NLU là một tập hợp con của NLP tập trung cụ thể vào khía cạnh hiểu biết —trích xuất ý nghĩa, mục đích và ngữ cảnh từ ngôn ngữ. NLP rộng hơn và cũng bao gồm các nhiệm vụ như tạo văn bản và tổng hợp giọng nói.
- Tạo văn bản : Đây là một khả năng hoặc nhiệm vụ cụ thể trong NLP tập trung vào việc tạo ra văn bản giống con người. Mặc dù là một phần cốt lõi của nhiều ứng dụng NLP (như chatbot hoặc dịch thuật), nhưng nó không bao gồm các khía cạnh hiểu biết hoặc phân tích của NLP.
- Computer Vision (CV) : CV xử lý việc diễn giải và hiểu thông tin từ các đầu vào trực quan như hình ảnh và video, tập trung vào các tác vụ như phát hiện đối tượng hoặc phân đoạn hình ảnh . Ngược lại, NLP tập trung vào dữ liệu ngôn ngữ. Tuy nhiên, các lĩnh vực này ngày càng giao thoa trong các mô hình đa phương thức xử lý cả văn bản và hình ảnh, cho phép các ứng dụng như chú thích hình ảnh tự động . Bạn có thể đọc thêm về việc kết nối NLP và CV . Ultralytics chuyên về CV, cung cấp các mô hình như Ultralytics YOLO11 cho các tác vụ đòi hỏi độ chính xác và tốc độ cao.
Công cụ và Nền tảng
Việc phát triển và triển khai các ứng dụng NLP thường liên quan đến việc tận dụng các thư viện và nền tảng chuyên dụng:
- Thư viện: Các thư viện nguồn mở như spaCy và NLTK cung cấp các công cụ cho các tác vụ NLP phổ biến như phân tích cú pháp, phân tích cú pháp và nhận dạng thực thể.
- Nền tảng: Hugging Face cung cấp kho lưu trữ lớn các mô hình được đào tạo trước (đặc biệt là Transformers), bộ dữ liệu và công cụ giúp tăng tốc đáng kể quá trình phát triển. Để quản lý vòng đời đầu cuối của các mô hình ML, bao gồm các mô hình được sử dụng trong NLP hoặc các đường ống CV-NLP kết hợp, các nền tảng như Ultralytics HUB cung cấp các khả năng MLOps mạnh mẽ, hợp lý hóa quá trình đào tạo, triển khai và giám sát. Khám phá tài liệu Ultralytics để biết thêm tài nguyên về phát triển và triển khai mô hình.