Khám phá cách Dịch máy sử dụng AI và học sâu để phá vỡ rào cản ngôn ngữ, cho phép giao tiếp và khả năng truy cập toàn cầu liền mạch.
Dịch máy (MT) là một nhiệm vụ trong Trí tuệ nhân tạo (AI) và ngôn ngữ học tính toán tập trung vào việc tự động chuyển đổi văn bản hoặc lời nói từ một ngôn ngữ tự nhiên (ngôn ngữ nguồn) sang một ngôn ngữ khác (ngôn ngữ đích). Nó tận dụng các thuật toán Học máy (ML) , đặc biệt là các mô hình Học sâu (DL) , được đào tạo trên một lượng lớn dữ liệu văn bản song song để học các mẫu phức tạp và sắc thái của quá trình chuyển đổi ngôn ngữ. Mục tiêu là tạo ra các bản dịch không chỉ chính xác về nghĩa mà còn trôi chảy và nghe tự nhiên trong ngôn ngữ đích.
Các hệ thống MT ban đầu chủ yếu dựa vào các phương pháp tiếp cận dựa trên quy tắc, sử dụng từ điển và các quy tắc ngữ pháp được các nhà ngôn ngữ học tỉ mỉ xây dựng. Sau đó, Dịch máy thống kê (SMT) xuất hiện, học các xác suất dịch từ các tập hợp văn bản song ngữ lớn như Europarl Corpus . Ngày nay, lĩnh vực này do Dịch máy thần kinh (NMT) thống trị, sử dụng các mạng nơ-ron sâu (NN) để mô hình hóa toàn bộ quá trình dịch. Các mô hình NMT, thường dựa trên các mô hình Chuỗi-sang-Chuỗi với các cơ chế chú ý hoặc kiến trúc Transformer có ảnh hưởng lớn (được giới thiệu trong bài báo nổi tiếng " Attention Is All You Need "), có thể nắm bắt các phụ thuộc tầm xa và các đặc điểm ngôn ngữ tinh tế, dẫn đến cải thiện đáng kể chất lượng dịch. Các mô hình này yêu cầu một lượng lớn dữ liệu đào tạo và tài nguyên tính toán, thường được quản lý bằng các nền tảng như Ultralytics HUB .
Dịch máy là một ứng dụng cụ thể trong lĩnh vực rộng hơn của Xử lý ngôn ngữ tự nhiên (NLP) . Mặc dù có liên quan, nhưng nó khác với các tác vụ NLP khác:
Dịch máy hỗ trợ nhiều ứng dụng giúp tạo điều kiện thuận lợi cho giao tiếp toàn cầu và truy cập thông tin:
MT là một lĩnh vực quan trọng trong nghiên cứu AI, thúc đẩy những tiến bộ trong kiến trúc mạng nơ-ron như Transformer, sau đó đã ảnh hưởng đến các mô hình trong các lĩnh vực khác, bao gồm cả thị giác máy tính . Đánh giá chất lượng MT thường liên quan đến các số liệu như điểm BLEU . Phát triển thường sử dụng các khuôn khổ như PyTorch hoặc TensorFlow và các bộ công cụ nguồn mở như Hugging Face Transformers , OpenNMT hoặc Fairseq cung cấp các mô hình và công cụ được đào tạo trước để xây dựng các hệ thống dịch tùy chỉnh.