Thuật ngữ

Dịch máy

Khám phá cách Dịch máy sử dụng AI và học sâu để phá vỡ rào cản ngôn ngữ, cho phép giao tiếp và khả năng truy cập toàn cầu liền mạch.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Dịch máy (MT) là một phân ngành của Trí tuệ nhân tạo (AI)Xử lý ngôn ngữ tự nhiên (NLP) tập trung vào việc tự động dịch văn bản hoặc lời nói từ ngôn ngữ tự nhiên này sang ngôn ngữ tự nhiên khác. Nó tận dụng ngôn ngữ học tính toán và thuật toán học máy (ML) để thu hẹp khoảng cách giao tiếp giữa các ngôn ngữ khác nhau mà không cần sự can thiệp của con người. Mục tiêu không chỉ là thay thế từng từ mà còn truyền đạt ý nghĩa và mục đích của văn bản nguồn một cách chính xác và trôi chảy trong ngôn ngữ đích. Công nghệ này ngày càng trở nên tinh vi, chuyển từ các hệ thống dựa trên quy tắc ban đầu sang các mô hình học sâu (DL) phức tạp.

Cách thức hoạt động của dịch máy

Các hệ thống MT ban đầu dựa trên các bộ quy tắc ngữ pháp và từ điển song ngữ mở rộng. Sau đó, Dịch máy thống kê (SMT) xuất hiện, học các mẫu dịch từ các tập hợp song song lớn (các văn bản được ghép nối với bản dịch của chúng). Tuy nhiên, công nghệ tiên tiến hiện tại là Dịch máy thần kinh (NMT). NMT sử dụng mạng nơ-ron nhân tạo (NN) để học cách ánh xạ giữa các ngôn ngữ.

Các mô hình NMT, đặc biệt là các mô hình dựa trên mô hình chuỗi-sang-chuỗi , thường sử dụng các kiến trúc như Mạng nơ-ron hồi quy (RNN) , cụ thể là LSTM hoặc GRU , hoặc phổ biến hơn hiện nay là kiến trúc Transformer . Transformer sử dụng các cơ chế tự chú ý ( bài báo Attention Is All You Need ) để cân nhắc tầm quan trọng của các từ khác nhau trong chuỗi đầu vào khi tạo từng từ trong chuỗi đầu ra, nắm bắt các phụ thuộc tầm xa hiệu quả hơn. Việc đào tạo các mô hình này đòi hỏi một lượng lớn dữ liệu văn bản song song và các tài nguyên tính toán đáng kể, thường sử dụng GPU hoặc TPU để đào tạo phân tán hiệu quả. Các khuôn khổ chính như PyTorchTensorFlow được sử dụng rộng rãi để phát triển các hệ thống NMT.

Các khái niệm và công nghệ chính

Một số khái niệm đóng vai trò trung tâm trong MT hiện đại:

  • Phân chia: Chia nhỏ văn bản đầu vào thành các đơn vị nhỏ hơn (từ, từ phụ hoặc ký tự) được gọi là mã thông báo để mô hình xử lý. ( Tìm hiểu thêm về Phân chia ).
  • Nhúng: Biểu diễn các mã thông báo dưới dạng các vectơ số dày đặc nắm bắt ý nghĩa ngữ nghĩa, cho phép mô hình hiểu được mối quan hệ giữa các từ. ( Khám phá Nhúng ).
  • Cơ chế chú ý: Cho phép mô hình tập trung vào các phần có liên quan của chuỗi đầu vào khi tạo đầu ra, rất quan trọng để xử lý các câu dài và cải thiện chất lượng bản dịch. ( Hiểu cơ chế chú ý ).
  • Điểm BLEU: Một số liệu phổ biến để đánh giá chất lượng MT bằng cách so sánh bản dịch do máy tạo ra với một hoặc nhiều bản dịch tham chiếu của con người ( Papineni và cộng sự, 2002 ).
  • Tìm kiếm theo chùm: Một thuật toán được sử dụng trong quá trình suy luận để tạo ra nhiều ứng viên dịch tiềm năng và chọn ứng viên có khả năng dịch cao nhất, cải thiện tính trôi chảy so với việc chỉ chọn từ tiếp theo có khả năng dịch cao nhất ở mỗi bước.

Phân biệt với các thuật ngữ liên quan

Mặc dù liên quan đến các nhiệm vụ NLP khác, MT có trọng tâm cụ thể:

Ứng dụng trong thế giới thực

Dịch máy hỗ trợ nhiều ứng dụng:

  • Giao tiếp tức thời: Các dịch vụ như Google DịchDeepL Translator cho phép người dùng dịch các trang web, tài liệu và tin nhắn theo thời gian thực, phá vỡ rào cản ngôn ngữ trên toàn cầu.
  • Bản địa hóa nội dung: Các doanh nghiệp sử dụng MT để dịch mô tả sản phẩm, hướng dẫn sử dụng, chiến dịch tiếp thị và trang web để tiếp cận thị trường quốc tế hiệu quả hơn so với việc chỉ dịch thủ công, thường sử dụng MT như bước đầu tiên sau đó là khâu rà soát của con người ( Hậu chỉnh sửa MT ).
  • Hỗ trợ khách hàng đa ngôn ngữ: Tích hợp MT vào chatbot và nền tảng dịch vụ khách hàng cho phép các công ty cung cấp hỗ trợ bằng nhiều ngôn ngữ.
  • Truy cập thông tin: Việc dịch các bài nghiên cứu, bài báo ( Reuters sử dụng MT ) và sách giúp thông tin có thể tiếp cận được qua các rào cản ngôn ngữ.
  • Ứng dụng dịch thuật thời gian thực: Các công cụ tích hợp vào ứng dụng giao tiếp hoặc thiết bị chuyên dụng cung cấp khả năng dịch gần như thời gian thực cho khách du lịch và cộng tác quốc tế ( Skype Translator ).

Mặc dù có tiến bộ đáng kể, vẫn còn nhiều thách thức, chẳng hạn như xử lý sắc thái, thành ngữ, bối cảnh văn hóa, ngôn ngữ ít tài nguyên và giảm thiểu sự thiên vị thuật toán học được từ dữ liệu. Công việc trong tương lai tập trung vào việc cải thiện nhận thức ngữ cảnh, xử lý sự mơ hồ, đạt được sự trôi chảy cao hơn và tích hợp MT với các phương thức khác như thị giác máy tính trong các mô hình đa phương thức . Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạotriển khai các mô hình AI tinh vi, có khả năng bao gồm các giải pháp MT tùy chỉnh trong tương lai.

Đọc tất cả