Thuật ngữ

Dịch máy

Khám phá cách Dịch máy sử dụng AI và học sâu để phá vỡ rào cản ngôn ngữ, cho phép giao tiếp và khả năng truy cập toàn cầu liền mạch.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Dịch máy (MT) là một nhiệm vụ trong Trí tuệ nhân tạo (AI) và ngôn ngữ học tính toán tập trung vào việc tự động chuyển đổi văn bản hoặc lời nói từ một ngôn ngữ tự nhiên (ngôn ngữ nguồn) sang một ngôn ngữ khác (ngôn ngữ đích). Nó tận dụng các thuật toán Học máy (ML) , đặc biệt là các mô hình Học sâu (DL) , được đào tạo trên một lượng lớn dữ liệu văn bản song song để học các mẫu phức tạp và sắc thái của quá trình chuyển đổi ngôn ngữ. Mục tiêu là tạo ra các bản dịch không chỉ chính xác về nghĩa mà còn trôi chảy và nghe tự nhiên trong ngôn ngữ đích.

Các khái niệm cốt lõi và sự tiến hóa

Các hệ thống MT ban đầu chủ yếu dựa vào các phương pháp tiếp cận dựa trên quy tắc, sử dụng từ điển và các quy tắc ngữ pháp được các nhà ngôn ngữ học tỉ mỉ xây dựng. Sau đó, Dịch máy thống kê (SMT) xuất hiện, học các xác suất dịch từ các tập hợp văn bản song ngữ lớn như Europarl Corpus . Ngày nay, lĩnh vực này do Dịch máy thần kinh (NMT) thống trị, sử dụng các mạng nơ-ron sâu (NN) để mô hình hóa toàn bộ quá trình dịch. Các mô hình NMT, thường dựa trên các mô hình Chuỗi-sang-Chuỗi với các cơ chế chú ý hoặc kiến trúc Transformer có ảnh hưởng lớn (được giới thiệu trong bài báo nổi tiếng " Attention Is All You Need "), có thể nắm bắt các phụ thuộc tầm xa và các đặc điểm ngôn ngữ tinh tế, dẫn đến cải thiện đáng kể chất lượng dịch. Các mô hình này yêu cầu một lượng lớn dữ liệu đào tạo và tài nguyên tính toán, thường được quản lý bằng các nền tảng như Ultralytics HUB .

Dịch máy so với các nhiệm vụ NLP liên quan

Dịch máy là một ứng dụng cụ thể trong lĩnh vực rộng hơn của Xử lý ngôn ngữ tự nhiên (NLP) . Mặc dù có liên quan, nhưng nó khác với các tác vụ NLP khác:

  • Hiểu ngôn ngữ tự nhiên (NLU): NLU tập trung vào việc cho phép máy móc hiểu được ý nghĩa của văn bản, bao gồm cả ý định và ngữ cảnh. MT sử dụng sự hiểu biết như một phần của quy trình nhưng mục tiêu chính của nó là chuyển đổi ngôn ngữ.
  • Tạo văn bản: Mặc dù MT là một dạng tạo văn bản , nhưng nó bị hạn chế bởi nhu cầu phải thể hiện chính xác ý nghĩa của văn bản nguồn bằng một ngôn ngữ khác. Tạo văn bản nói chung có thể bao gồm việc tạo ra toàn bộ văn bản mới dựa trên lời nhắc.
  • Speech-to-Text & Text-to-Speech: Speech-to-text chuyển đổi âm thanh nói thành văn bản và text-to-speech thực hiện ngược lại. Những công nghệ này xử lý các thay đổi về phương thức, trong khi MT chủ yếu tập trung vào các thay đổi về ngôn ngữ trong phương thức văn bản (mặc dù các hệ thống dịch giọng nói thường kết nối các thành phần này).

Ứng dụng trong thế giới thực

Dịch máy hỗ trợ nhiều ứng dụng giúp tạo điều kiện thuận lợi cho giao tiếp toàn cầu và truy cập thông tin:

  1. Công cụ dịch trực tuyến: Các dịch vụ như Google DịchDeepL Translator cung cấp bản dịch tức thời các đoạn văn bản, tài liệu và toàn bộ trang web cho hàng tỷ người dùng trên toàn thế giới, phá vỡ rào cản giao tiếp.
  2. Nền tảng giao tiếp đa ngôn ngữ: Tính năng dịch thuật thời gian thực được tích hợp vào các ứng dụng nhắn tin (như Skype Translator) hoặc nền tảng mạng xã hội cho phép người dùng nói nhiều ngôn ngữ khác nhau giao tiếp liền mạch.
  3. Bản địa hóa nội dung: Các doanh nghiệp sử dụng MT (thường kết hợp với biên tập hậu kỳ bằng tay) để điều chỉnh trang web, giao diện phần mềm và tài liệu tiếp thị cho đối tượng quốc tế một cách nhanh chóng và tiết kiệm chi phí.
  4. Truy cập thông tin: Các công cụ tìm kiếm sử dụng MT để lập chỉ mục và truy xuất thông tin trên nhiều ngôn ngữ, mở rộng khả năng truy cập vào các cơ sở tri thức toàn cầu. Các công cụ do các tổ chức như Hiệp hội Ngôn ngữ học tính toán (ACL) phát triển thường mở rộng ranh giới của các ứng dụng này.

Sự liên quan và Công cụ

MT là một lĩnh vực quan trọng trong nghiên cứu AI, thúc đẩy những tiến bộ trong kiến trúc mạng nơ-ron như Transformer, sau đó đã ảnh hưởng đến các mô hình trong các lĩnh vực khác, bao gồm cả thị giác máy tính . Đánh giá chất lượng MT thường liên quan đến các số liệu như điểm BLEU . Phát triển thường sử dụng các khuôn khổ như PyTorch hoặc TensorFlow và các bộ công cụ nguồn mở như Hugging Face Transformers , OpenNMT hoặc Fairseq cung cấp các mô hình và công cụ được đào tạo trước để xây dựng các hệ thống dịch tùy chỉnh.

Đọc tất cả