Tương lai của dịch tự động: liệu có thể vượt qua con người?

Bài đăng này đã không được cập nhật trong 7 năm

Khái niệm

Trước hết, hãy xem lại khái niệm về dịch tự động. “Dịch tự động hay còn gọi là dịch máy (tiếng Anh: machine translation) là một nhánh của xử lý ngôn ngữ tự nhiên thuộc phân ngành trí tuệ nhân tạo, nó là sự kết hợp giữa ngôn ngữ, dịch thuật và khoa học máy tính. Như tên gọi, dịch tự động thực hiện dịch một ngôn ngữ này (gọi là ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (gọi là ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch.” (Wikipedia)

Hiểu 1 cách nôm na thì dịch tự động là khi bạn dịch 1 văn bản mà không cần đến sự can thiệp của con người. Máy móc sẽ làm công việc đấy thay cho bạn.

Trí tuệ nhân tạo đã tạo ra những cỗ máy dịch tự động như thế nào

Ngày nay, các công cụ dịch tự động, hay dịch máy đã thực sự phát triển, với sự thông minh và chính xác đến mức độ có thể nói là tương đối gần với khả năng của con người. Vậy liệu rằng trong tương lai, dịch tự động có thể vượt qua cả dịch thuật bằng “con người” hay không? Hay nói cách khác, liệu rằng trong tương lai những phiên dịch, biên dịch viên có bị thất nghiệp hay không? Như các bạn cũng biết, trí tuệ nhân tạo (AI) đang ngày càng phát triển, thời gian gần đây nhiều ứng dụng sử dụng công nghệ AI đã được đưa vào cuộc sống thực tiễn. Trong đó, các ứng dụng dịch tự động, đặc biệt là Google translate, với công nghệ deep learning đã nâng mức độ chính xác lên tới mức độ khó tin, khiến cho không ít người phải đặt ra nghi vấn về khả năng trong 1 tương lai không xa, nó sẽ khiến cho nghề biên phiên dịch “đi vào dĩ vãng”.

Tuy nhiên, câu trả lời chính xác cho điều đó vẫn còn ở thì tương lai. Cho đến thời điểm hiện tại, mặc dù đã đạt mức độ chính xác đáng kinh ngạc, nhưng không có nghĩa là Google translate có thể dịch được chính xác tất cả các văn bản. Vậy những câu văn như nào thì Google translate có thể dịch chính xác? Và những câu văn như nào thì dịch thiếu chính xác? Theo như tôi nhận thấy thì những những câu văn có cấu trúc chuẩn, văn cứng, kiểu như các văn bản hành chính…thì cỗ máy dịch này có thể dịch chính xác hoặc tương đối chính xác. Ngược lại, những câu văn không có cấu trúc chuẩn, như là văn nói giao tiếp, hay văn chương có tính bay bổng, sáng tạo như trong các tác phẩm văn học,…

Tôi đã thử dịch 1 đoạn ngắn trong truyện “Dế mèn phiêu lưu ký” nổi tiếng của tác giả Tô Hoài:

“Chẳng bao lâu tôi đã trở thành một chàng dế thanh niên cường tráng. Ðôi càng tôi mẫm bóng. Những cái vuốt ở chân, ở khoeo cứ cứng dần và nhọn hoắt.”

bằng Google translate sang tiếng Anh thì nhận được kết quả như sau:

"Soon I became a strong young cricketer. The more I melt the ball. The claws in the legs, the stools are stiff and sharp.”

Câu đầu tiên được dịch tương đối chính xác về ngữ nghĩa, mặc dù “strong young” không đủ để lột tả tính tượng hình của tính từ “cường tráng” trong tiếng Việt. Còn sang câu thứ 2 thì ý nghĩa dịch ra sai hoàn toàn: “Ðôi càng tôi mẫm bóng.” lại được dịch thành “The more I melt the ball.”, hoàn toàn không liên quan tới câu gốc. Sự sai khác này, theo tôi nghĩ là bởi câu văn của Tô Hoài quá “lạ”, vì “mẫm bóng” là tính từ hiếm khi được sử dụng, có lẽ tác giả ghép 2 tính từ “mụ mẫm” và “bóng bẩy” lại thành 1 tính từ giàu tính gợi hình “mẫm bóng”, điều đó đã làm khó Google translate, cỗ máy dịch chưa được đào tạo kỹ càng về tiếng Việt. Hiện tượng trên dễ dàng bắt gặp khi chúng ta sử dụng các công cụ dịch tự động, không chỉ là Google translate mà bao gồm cả các công cụ khác hiện có trên thế giới, với mục đích dịch các văn bản sang tạo, không tuân theo quy chuẩn nhất định từ ngôn ngữ này sang ngôn ngữ khác. Khoảng trống này, có lẽ là mảnh đất màu mỡ, hứa hẹn để các ông lớn về dịch tự động phát triển và nâng cấp hệ thống hơn nữa, mà có lẽ, quãng đường cải tiến dịch vụ còn rất nhiều khó khan, đòi hỏi tích luỹ data qua nhiều năm.

Vì sao dịch tự động vẫn "thua" con người

Thử phân tích nguyên nhân vì sao các hệ thống dịch tự động hiện nay chưa thể “hiểu” được ngôn ngữ tự nhiên 1 cách chuẩn xác như con người. Theo tôi, có 1 nguyên nhân rất quan trọng, đó là ý nghĩa của 1 câu văn không chỉ được thể hiện qua thông tin về “bề mặt” của câu văn đó, tức là ý nghĩa thể hiện qua tổ hợp cấu trúc “từ ngữ + ngữ pháp” mà câu văn đó sử dụng, mà còn biểu hiện qua văn cảnh, bối cảnh trước sau, hay những thông tin mang ý nghĩa “kiến thức thường thức” mà câu văn đó mang lại. Tôi định nghĩa cái đó là “Thông tin mang giá trị không gian”. Mà những thông tin đó thì máy tính, rất tiếc, vẫn chưa đủ khả năng hiểu được. Chừng nào, máy tính có thể tiếp nhận và xử lý được thông tin mang giá trị không gian này thì tôi tin rằng dịch máy sẽ tiệm cận với khả năng dịch thuật của con người, hay nói cách khác, lúc đó con người và máy tính có thể giao tiếp suôn sẻ với nhau!

Những ai quan tâm đến dịch thuật tự động hẳn sẽ biết đến công nghệ có tên là Neural Machine Translation (NMT). Đây là phương pháp dịch thuật của Google Translate bắt đầu được áp dụng từ bản update tháng 11/2016. Phương pháp này có điểm ưu việt là thay vì dịch từng phần, công nghệ này thực hiện dịch toàn bộ câu cùng lúc, nó mô phỏng bộ não con người, bắt chước hành động của con người. Theo tôi được biết “thủ thuật” của phương pháp này là nó hoán đổi câu văn được nhập sang 1 biểu hiện mang tính trung gian nào đó rồi mới dịch, tức là nó cố gắng hiểu ngôn ngữ tự nhiên trước khi dịch, nên có thể khẳng định là định hướng của Google Translate khi sử dụng công nghệ này tương đối thông minh. Tuy nhiên, Google dựa vào thông tin như thế nào, bao gồm những dữ liệu gì để tạo nên “biểu hiện mang tính trung gian” đó thì còn là nghi vấn, vì vậy là kết quả dịch nhận được chưa thực sự làm thoả mãn người dung.

Tạm kết luận

10 năm tới, khả năng dịch tự động có thể thay thế được hoàn toàn con người là chuyện không phải là không thể. Điều đó có nghĩa là những biên phiên dịch viên nên lo dần về nguy cơ thất nghiệp trong tương lai của mình.

Tuy nhiên cũng phải thừa nhận rằng, mặc dù việc cải tiến công nghệ dịch thuật của máy móc sẽ mang lại rất nhiều lợi ích cho xã hội, nhưng chúng ta không nên kỳ vọng về 1 công cụ dịch hoàn hảo, chính xác đến 100%. Điều đó ngay cả con người cũng không làm được, đơn giản vì giữa các ngôn ngữ khác nhau vốn ẩn chứa sự khác biệt được tạo nên bởi văn hoá, phong tục, con người,... Và bởi vì, bạn thử nghĩ xem, để có thể nhận ra được những sai sót của dịch máy, điều đương nhiên là con người phải đạt được trình độ dịch thuật cao hơn như thế.

Có lẽ, thay vì quá ý lại vào dịch tự động, con người trước hết nên tự nâng cao năng lực ngôn ngữ của mình đã. Đồng thời, con người có thể cải thiện được năng lực của mình bằng việc sử dụng công cụ dịch tự động 1 cách thông minh và hiệu quả.

Khái niệm

Trí tuệ nhân tạo đã tạo ra những cỗ máy dịch tự động như thế nào

Vì sao dịch tự động vẫn "thua" con người

Tạm kết luận

Mục lục