Thuật ngữ

Xử lý ngôn ngữ tự nhiên (NLP)

Khám phá các khái niệm, kỹ thuật và ứng dụng Xử lý ngôn ngữ tự nhiên (NLP) như chatbot, phân tích tình cảm và dịch máy.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Xử lý ngôn ngữ tự nhiên (NLP) là một lĩnh vực năng động trong Trí tuệ nhân tạo (AI)Học máy (ML) chuyên cho phép máy tính hiểu, xử lý, diễn giải và tạo ra ngôn ngữ của con người—cả văn bản và lời nói. Nó kết hợp ngôn ngữ học tính toán với mô hình thống kê, ML và các mô hình Học sâu (DL) để thu hẹp khoảng cách giữa giao tiếp của con người và khả năng hiểu của máy tính. Mục tiêu là cho phép máy móc tương tác với ngôn ngữ theo cách vừa có ý nghĩa vừa hữu ích.

Các khái niệm chính trong NLP

NLP bao gồm một số nhiệm vụ cốt lõi phân tích ngôn ngữ thành các thành phần dễ hiểu đối với máy móc:

  • Phân chia thành các đơn vị nhỏ hơn: Quá trình chia văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ hoặc từ phụ (mã thông báo).
  • Đánh dấu từ loại (POS): Gán các loại ngữ pháp (danh từ, động từ, tính từ) cho mỗi từ.
  • Nhận dạng thực thể được đặt tên (NER) : Xác định và phân loại các thực thể chính trong văn bản, như tên người, tổ chức, địa điểm, ngày tháng, v.v.
  • Phân tích tình cảm : Xác định tông điệu cảm xúc (tích cực, tiêu cực, trung tính) được thể hiện trong một đoạn văn bản.
  • Dịch máy : Tự động dịch văn bản hoặc lời nói từ ngôn ngữ này sang ngôn ngữ khác. Điều này được minh họa bằng các công cụ như Google Dịch .
  • Mô hình hóa ngôn ngữ : Dự đoán khả năng xuất hiện của một chuỗi từ, là yếu tố cơ bản cho các nhiệm vụ như tạo văn bản.

NLP hoạt động như thế nào

Các hệ thống NLP thường tuân theo phương pháp tiếp cận đường ống. Dữ liệu văn bản thô trải qua quá trình xử lý trước (như mã hóa và làm sạch) trước khi các tính năng được trích xuất. Các tính năng này sau đó được đưa vào các mô hình ML hoặc DL. NLP hiện đại phụ thuộc rất nhiều vào mạng nơ-ron, đặc biệt là các kiến trúc như Mạng nơ-ron hồi quy (RNN) và gần đây hơn là Transformers . Transformers, được biết đến với cơ chế chú ý của chúng, rất giỏi trong việc nắm bắt ngữ cảnh trong ngôn ngữ, cung cấp năng lượng cho các mô hình tiên tiến như GPT-4 . Các nền tảng nghiên cứu như ACL Anthology lưu trữ nhiều bài báo trình bày chi tiết về những tiến bộ này.

Ứng dụng của NLP

NLP cung cấp năng lượng cho nhiều ứng dụng đang chuyển đổi các ngành công nghiệp và tương tác hàng ngày:

  1. Trợ lý ảo và Chatbot: Các hệ thống như Amazon Alexa, Google Trợ lý và chatbot dịch vụ khách hàng sử dụng NLP để hiểu các truy vấn của người dùng và phản hồi một cách tự nhiên. Chúng sử dụng các kỹ thuật như nhận dạng giọng nóiHiểu ngôn ngữ tự nhiên (NLU) .
  2. Phân tích tình cảm cho nghiên cứu thị trường: Các công ty phân tích các bài đăng trên mạng xã hội, đánh giá của khách hàng và phản hồi khảo sát bằng cách sử dụng phân tích tình cảm để đánh giá ý kiến của công chúng về sản phẩm hoặc thương hiệu, giúp đưa ra chiến lược kinh doanh. Khám phá các trường hợp sử dụng AI để biết thêm ví dụ.

Các ứng dụng phổ biến khác bao gồm lọc email rác, tóm tắt văn bản , công cụ tìm kiếm ngữ nghĩa và các công cụ sửa lỗi ngữ pháp như Grammarly .

NLP so với các khái niệm liên quan

Mặc dù có liên quan, NLP khác với các thuật ngữ tương tự:

  • Hiểu ngôn ngữ tự nhiên (NLU): Một lĩnh vực con của NLP tập trung cụ thể vào khả năng hiểu đọc của máy – hiểu ý nghĩa đằng sau văn bản. NLP rộng hơn, bao gồm cả việc tạo ra và các nhiệm vụ khác.
  • Tạo văn bản : Một ứng dụng cụ thể trong NLP tập trung vào việc tạo ra văn bản giống con người.
  • Computer Vision (CV) : Xử lý việc diễn giải thông tin trực quan từ hình ảnh hoặc video. Mặc dù khác biệt, NLP và CV thường được kết hợp trong các mô hình đa phương thức cho các tác vụ như chú thích hình ảnh hoặc trả lời câu hỏi trực quan. Tìm hiểu thêm về việc kết nối NLP và CV . Ultralytics YOLO các mô hình, chủ yếu dành cho các tác vụ CV như phát hiện đối tượng , có thể được tích hợp vào các hệ thống cũng tận dụng NLP.

Công cụ và Nền tảng

Phát triển các ứng dụng NLP thường liên quan đến việc sử dụng các thư viện và khuôn khổ như spaCy hoặc NLTK, và các nền tảng như Hugging Face cung cấp quyền truy cập vào nhiều mô hình và bộ dữ liệu được đào tạo trước. Để triển khai và quản lý các mô hình, bao gồm cả những mô hình được sử dụng trong NLP hoặc các đường ống CV-NLP kết hợp, các nền tảng như Ultralytics HUB cung cấp các khả năng MLOps mạnh mẽ.

Đọc tất cả