Thuật ngữ

Dịch máy

Khám phá cách Dịch máy sử dụng AI và học sâu để phá vỡ rào cản ngôn ngữ, cho phép giao tiếp và khả năng truy cập toàn cầu liền mạch.

Dịch máy (MT) là một phân ngành của Trí tuệ nhân tạo (AI) và Xử lý ngôn ngữ tự nhiên (NLP) tập trung vào việc tự động dịch văn bản hoặc lời nói từ ngôn ngữ tự nhiên này sang ngôn ngữ tự nhiên khác. Nó tận dụng ngôn ngữ học tính toán và thuật toán học máy (ML) để thu hẹp khoảng cách giao tiếp giữa các ngôn ngữ khác nhau mà không cần sự can thiệp của con người. Mục tiêu không chỉ là thay thế từng từ mà còn truyền đạt ý nghĩa và mục đích của văn bản nguồn một cách chính xác và trôi chảy trong ngôn ngữ đích. Công nghệ này ngày càng trở nên tinh vi, chuyển từ các hệ thống dựa trên quy tắc ban đầu sang các mô hình học sâu (DL) phức tạp.

Cách thức hoạt động của dịch máy

Các hệ thống MT ban đầu dựa trên các bộ quy tắc ngữ pháp và từ điển song ngữ mở rộng. Sau đó, Dịch máy thống kê (SMT) xuất hiện, học các mẫu dịch từ các tập hợp song song lớn (các văn bản được ghép nối với bản dịch của chúng). Tuy nhiên, công nghệ tiên tiến hiện tại là Dịch máy thần kinh (NMT). NMT sử dụng mạng nơ-ron nhân tạo (NN) để học cách ánh xạ giữa các ngôn ngữ.

Các mô hình NMT, đặc biệt là các mô hình dựa trên mô hình chuỗi-sang-chuỗi , thường sử dụng các kiến trúc như Mạng nơ-ron hồi quy (RNN) , cụ thể là LSTM hoặc GRU , hoặc phổ biến hơn hiện nay là kiến trúc Transformer . Transformer sử dụng các cơ chế tự chú ý ( bài báo Attention Is All You Need ) để cân nhắc tầm quan trọng của các từ khác nhau trong chuỗi đầu vào khi tạo từng từ trong chuỗi đầu ra, nắm bắt các phụ thuộc tầm xa hiệu quả hơn. Việc đào tạo các mô hình này đòi hỏi một lượng lớn dữ liệu văn bản song song và các tài nguyên tính toán đáng kể, thường sử dụng GPU hoặc TPU để đào tạo phân tán hiệu quả. Các khuôn khổ chính như PyTorch và TensorFlow được sử dụng rộng rãi để phát triển các hệ thống NMT.

Các khái niệm và công nghệ chính

Một số khái niệm đóng vai trò trung tâm trong MT hiện đại:

Phân chia: Chia nhỏ văn bản đầu vào thành các đơn vị nhỏ hơn (từ, từ phụ hoặc ký tự) được gọi là mã thông báo để mô hình xử lý. ( Tìm hiểu thêm về Phân chia ).
Nhúng: Biểu diễn các mã thông báo dưới dạng các vectơ số dày đặc nắm bắt ý nghĩa ngữ nghĩa, cho phép mô hình hiểu được mối quan hệ giữa các từ. ( Khám phá Nhúng ).
Cơ chế chú ý: Cho phép mô hình tập trung vào các phần có liên quan của chuỗi đầu vào khi tạo đầu ra, rất quan trọng để xử lý các câu dài và cải thiện chất lượng bản dịch. ( Hiểu cơ chế chú ý ).
Điểm BLEU: Một số liệu phổ biến để đánh giá chất lượng MT bằng cách so sánh bản dịch do máy tạo ra với một hoặc nhiều bản dịch tham chiếu của con người ( Papineni và cộng sự, 2002 ).
Tìm kiếm theo chùm: Một thuật toán được sử dụng trong quá trình suy luận để tạo ra nhiều ứng viên dịch tiềm năng và chọn ứng viên có khả năng dịch cao nhất, cải thiện tính trôi chảy so với việc chỉ chọn từ tiếp theo có khả năng dịch cao nhất ở mỗi bước.

Phân biệt với các thuật ngữ liên quan

Mặc dù liên quan đến các nhiệm vụ NLP khác, MT có trọng tâm cụ thể:

Xử lý ngôn ngữ tự nhiên (NLP): Lĩnh vực rộng hơn bao gồm MT, tóm tắt văn bản , phân tích tình cảm , trả lời câu hỏi , v.v. MT là một ứng dụng trong NLP.
Hiểu ngôn ngữ tự nhiên (NLU): Tập trung vào khả năng hiểu ý nghĩa văn bản của máy, bao gồm nhận dạng ý định và trích xuất thực thể. Trong khi khả năng của NLU tăng cường MT, bản thân NLU là về sự hiểu biết, không nhất thiết là bản dịch. ( Xem mục chú giải thuật ngữ NLU ).
Nhận dạng giọng nói: Chuyển đổi âm thanh nói thành văn bản. Văn bản này sau đó có thể được sử dụng làm đầu vào cho hệ thống MT. ( Xem mục từ vựng Nhận dạng giọng nói ).
Chuyển văn bản thành giọng nói (TTS): Chuyển đổi đầu ra văn bản (có thể từ hệ thống MT) thành giọng nói tổng hợp. ( Xem mục từ trong thuật ngữ Chuyển văn bản thành giọng nói ).
Mô hình hóa ngôn ngữ: Nhiệm vụ dự đoán từ tiếp theo trong một chuỗi, là cơ bản đối với nhiều tác vụ NLP bao gồm NMT, nhưng không phải bản dịch. ( Khám phá Mô hình hóa ngôn ngữ ).

Ứng dụng trong thế giới thực

Dịch máy hỗ trợ nhiều ứng dụng:

Giao tiếp tức thời: Các dịch vụ như Google Dịch và DeepL Translator cho phép người dùng dịch các trang web, tài liệu và tin nhắn theo thời gian thực, phá vỡ rào cản ngôn ngữ trên toàn cầu.
Bản địa hóa nội dung: Các doanh nghiệp sử dụng MT để dịch mô tả sản phẩm, hướng dẫn sử dụng, chiến dịch tiếp thị và trang web để tiếp cận thị trường quốc tế hiệu quả hơn so với việc chỉ dịch thủ công, thường sử dụng MT như bước đầu tiên sau đó là khâu rà soát của con người ( Hậu chỉnh sửa MT ).
Hỗ trợ khách hàng đa ngôn ngữ: Tích hợp MT vào chatbot và nền tảng dịch vụ khách hàng cho phép các công ty cung cấp hỗ trợ bằng nhiều ngôn ngữ.
Truy cập thông tin: Việc dịch các bài nghiên cứu, bài báo ( Reuters sử dụng MT ) và sách giúp thông tin có thể tiếp cận được qua các rào cản ngôn ngữ.
Ứng dụng dịch thuật thời gian thực: Các công cụ tích hợp vào ứng dụng giao tiếp hoặc thiết bị chuyên dụng cung cấp khả năng dịch gần như thời gian thực cho khách du lịch và cộng tác quốc tế ( Skype Translator ).

Mặc dù có tiến bộ đáng kể, vẫn còn nhiều thách thức, chẳng hạn như xử lý sắc thái, thành ngữ, bối cảnh văn hóa, ngôn ngữ ít tài nguyên và giảm thiểu sự thiên vị thuật toán học được từ dữ liệu. Công việc trong tương lai tập trung vào việc cải thiện nhận thức ngữ cảnh, xử lý sự mơ hồ, đạt được sự trôi chảy cao hơn và tích hợp MT với các phương thức khác như thị giác máy tính trong các mô hình đa phương thức . Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạo và triển khai các mô hình AI tinh vi, có khả năng bao gồm các giải pháp MT tùy chỉnh trong tương lai.

Dịch máy

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM

Cách thức hoạt động của dịch máy

Các khái niệm và công nghệ chính

Phân biệt với các thuật ngữ liên quan

Ứng dụng trong thế giới thực

Đọc thêm blog

Tham gia Ultralytics cộng đồng