Nếu coi Google Translate (NMT) là thế hệ thứ 3, thì AI dịch thuật dựa trên mô hình ngôn ngữ lớn (LLM) có thể được xem là thế hệ thứ 4.
Đặc điểm của thế hệ thứ 4 là so với thế hệ thứ 3, nó có thể dễ dàng học được các quy tắc (ở một mức độ nào đó) về cách dịch "thuật ngữ" và "cụm từ".
Ở điểm này, thế hệ thứ 4 rất giống với dịch máy thế hệ thứ 1 (dựa trên quy tắc).
Thế hệ thứ 3 cũng có các chức năng như bảng thuật ngữ, hoặc nếu là Google Translate thì có các phương pháp học chuyển giao như AutoML, cho phép điều chỉnh theo nhu cầu của doanh nghiệp, nhưng tác dụng phụ lại quá lớn, thường dẫn đến việc chất lượng bản dịch bị giảm sút. Chức năng của bảng thuật ngữ chỉ có thể sử dụng cho danh từ, và phương pháp học chuyển giao (AutoML) cũng quá phức tạp. Và cũng khó có thể nói rằng nó mang lại hiệu quả.
Ở thế hệ thứ 4, bạn chỉ cần đăng ký các quy tắc dịch thuật cho thuật ngữ và cụm từ vào hệ thống, và vì được xây dựng trên mô hình ngôn ngữ lớn, bạn có thể quy định các quy tắc theo cùng cách như khi đưa ra chỉ dẫn cho con người.
Ví dụ, giả sử bạn muốn dịch "製品" thành "product". Bạn sẽ đăng ký điều này vào từ điển, nhưng ở thế hệ thứ 3, từ dịch "product" sẽ bị cố định như một chuỗi ký tự, không được chia số nhiều và cũng không được viết hoa thành "Product" khi dùng làm tiêu đề. Ở thế hệ thứ 4, hệ thống sẽ tự động xử lý các dạng biến đổi cần thiết.
Thế hệ thứ 4 đã cho phép các dịch giả cá nhân có thể tự phát triển AI dịch thuật ở cấp độ cá nhân. Ở thế hệ đầu tiên của dịch máy dựa trên quy tắc, các dịch giả cá nhân phải mua phần mềm dịch máy, tự mình đăng ký từ điển một cách tỉ mỉ và dần dần cải thiện kết quả dịch máy (dù đó là một nỗ lực tốn công mà hiệu quả lại rất ít). Ở thế hệ thứ 4 cũng có thể làm được điều tương tự.
Ở thế hệ thứ 4, bạn cũng có thể đăng ký bảng thuật ngữ và cả bộ nhớ dịch (TM) là tài sản dịch thuật trong quá khứ. Bạn cũng có thể đăng ký cách dịch ở cấp độ cụm từ. Hơn nữa, chất lượng dịch cơ bản cũng khá tốt. Có thể phát triển dịch máy mà không gây ra tác dụng phụ nào.
Việc chuyển giao thế hệ giữa dịch máy và dịch AI thường diễn ra khoảng mỗi 10 năm. Có lẽ sau 10 năm nữa sẽ xuất hiện thế hệ thứ 5, nhưng tôi hoàn toàn không thể tưởng tượng nó sẽ như thế nào.
Tuy nhiên, chắc chắn trong 10 năm tới, AI dịch thuật thế hệ thứ 4 sẽ đóng vai trò trung tâm.