Tổng quan về dịch máy – Phần 2

Đọc phần 1 tại đây

IV/ DỊCH MÁY VÀ DỊCH CÓ SỰ HỖ TRỢ CÚA MÁY TÍNH (CAT)

Dịch máy (MT) và Dịch có sự hỗ trợ của máy tính (CAT) là hai cách tiếp cận khác nhau để dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác. Chúng có một số điểm tương đồng đồng thời cũng có nhiều khác biệt.

Tương đồng:

  • Cả MT và CAT đều sử dụng công nghệ máy tính (computer technology) để hỗ trợ quá trình dịch thuật.
  • Cả hai phương pháp đều có thể tiết kiệm thời gian so với dịch thủ công (manual translation).
  • Cả hai đều có thể giúp duy trì tính nhất quán giữa các bản dịch (maintain consistency across translations).

Khác biệt:

Dịch máy (MT) hoàn toàn tự động, trong đó một phần mềm máy tính dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác mà không cần sự can thiệp của con người (without human intervention). Trong khi đó (on the other hand), Dịch thuật có sự hỗ trợ của máy tính (CAT) là một quy trình dịch thuật do con người thực hiện (human-based translation), trong đó người dịch sử dụng các công cụ phần mềm để hỗ trợ họ trong quá trình dịch thuật. Người dịch giữ toàn quyền kiểm soát (retain full control) quá trình dịch và phần mềm chỉ đơn giản là một công cụ hỗ trợ họ.

MT thường nhanh hơn CAT, vì nó không yêu cầu sự tham gia hoặc rà soát của con người (does not require human input or review). Tuy nhiên, chất lượng của bản dịch thường thấp hơn so với bản dịch của con người, vì MT thường thiếu ngữ cảnh và có thể mắc lỗi.

Các công cụ CAT (CAT tools) được thiết kế để hỗ trợ người dịch trong quá trình dịch thuật. Chúng cung cấp các tính năng như bộ nhớ dịch (translation memory) nhằm lưu trữ nội dung đã dịch trước đó (previously translated content) nhằm hỗ trợ tính nhất quán và hiệu quả, cũng như công cụ quản lý thuật ngữ (terminology management), giúp đảm bảo việc sử dụng thuật ngữ nhất quán. Những tính năng (features) này giúp người dịch làm việc nhanh hơn và chính xác hơn.

MT phù hợp hơn cho các tác vụ yêu cầu số lượng bản dịch lớn trong thời gian ngắn, chẳng hạn như các bài báo hoặc bản tin thời tiết. CAT phù hợp hơn cho các tác vụ đòi hỏi độ chính xác cao và chú ý đến từng chi tiết, chẳng hạn như tài liệu pháp lý hoặc y tế.

Tóm lại, trong khi cả Dịch máy và Dịch có sự hỗ trợ của máy tính đều sử dụng công nghệ máy tính để hỗ trợ quá trình dịch, thì điểm khác biệt chính là MT hoàn toàn tự động, trong khi CAT là quy trình dịch dựa trên con người được hỗ trợ bởi các công cụ phần mềm. MT thường nhanh hơn nhưng chất lượng thấp hơn so với bản dịch của con người, trong khi CAT chậm hơn nhưng cung cấp bản dịch chất lượng cao hơn với sự hỗ trợ của các công cụ phần mềm.

v/ BỘ NHỚ DỊCH HOẠT ĐỘNG RA SAO

Bộ nhớ dịch (Translation Memory, TM) là cơ sở dữ liệu (database) lưu trữ nội dung đã dịch trước đó (previously translated content) để sử dụng lại (reuse) trong các bản dịch sau này. TM là một công cụ quan trọng trong quá trình dịch thuật, vì nó có thể giúp nâng cao hiệu quả, tính nhất quán (consistency) và độ chính xác (accuracy).

Dưới đây là cách hoạt động tiêu biểu của TM:

Phân tích tài liệu nguồn (source document): Khi cần dịch một tài liệu mới, hệ thống TM sẽ phân tích tài liệu nguồn và chia nhỏ tài liệu đó thành các phân đoạn (segment), chẳng hạn như câu hoặc đoạn văn.

Tìm kiếm các bản dịch hiện có: Hệ thống TM tìm kiếm cơ sở dữ liệu của nó cho các bản dịch hiện có của từng phân đoạn. Nếu tìm thấy sự trùng khớp (match), hệ thống sẽ truy xuất (retrieve) bản dịch và trình bày cho người dịch để xem xét.

Bổ sung bản dịch mới: Nếu một phân đoạn không khớp với bất kỳ bản dịch hiện có nào, người dịch sẽ dịch nó theo cách thủ công (manually). Bản dịch mới này sau đó được thêm vào cơ sở dữ liệu TM để sử dụng trong tương lai.

Khớp nối (match) và tái sử dụng các phân đoạn (segment): Khi người dịch làm việc với tài liệu, hệ thống TM tiếp tục tìm kiếm các kết quả phù hợp cho từng phân đoạn mới. Nếu tìm thấy bản dịch phù hợp, hệ thống có thể tự động chèn (insert) bản dịch hiện có hoặc đề xuất bản dịch đó để người dịch đánh giá.

Bằng cách sử dụng lại các bản dịch hiện có theo cách này, TM có thể giúp giảm thời gian và công sức cần thiết cho bản dịch, đồng thời cải thiện tính nhất quán và chính xác. TM cũng có thể được tùy chỉnh cho các lĩnh vực (domain) hoặc khách hàng cụ thể và có thể được tích hợp (integrated) với các công cụ dịch thuật và quy trình công việc khác để nâng cao hơn nữa hiệu quả và chất lượng.

VI/ VAI TRÒ CỦA CON NGƯỜI TRONG QUÁ TRÌNH DỊCH MÁY

Dịch máy hay dịch tự động được được nghĩa là việc tạo ra các bản dịch một cách tự động (automatic generation of translation) mà không có sự can thiệp của con người. Tuy nhiên, dù các hệ thống dịch máy (MT) đã đạt được những bước tiến lớn (make great strides)  trong những năm gần đây, nhưng chúng vẫn chưa hoàn hảo và sự tham gia của con người vẫn cần thiết để đảm bảo chất lượng bản dịch. Con người có thể có vai trò trong quá trình dịch máy theo nhiều cách:

Thu thập và làm sạch dữ liệu (Data collection and cleaning): Các hệ thống MT dựa vào một lượng lớn dữ liệu song ngữ để học hỏi. Người dịch có thể giúp thu thập, chú thích (annotate) và làm sạch dữ liệu này để đảm bảo dữ liệu có chất lượng cao và phù hợp để sử dụng trong các hệ thống MT.

Đào tạo và điều chỉnh (Training and tuning): Khi một hệ thống MT đã được xây dựng, nó phải được đào tạo và điều chỉnh để tạo ra các bản dịch chất lượng cao. Người dịch (human translator) có thể trợ giúp bằng cách xem xét và sửa (reviewing and correcting) các bản dịch do hệ thống tạo ra, và điều này có thể giúp hệ thống học hỏi từ những lỗi sai và cải thiện theo thời gian.

Chỉnh sửa hậu kỳ (post-editing): Ngay cả những hệ thống MT tốt nhất cũng sẽ mắc lỗi và việc chỉnh sửa hậu kỳ của con người có thể được sử dụng để sửa những lỗi này và đảm bảo chất lượng của bản dịch cuối cùng. Chỉnh sửa hậu kỳ có thể liên quan đến mọi thứ, từ chỉnh sửa nhỏ đến viết lại toàn bộ, tùy thuộc vào chất lượng của đầu ra MT ban đầu và mức chất lượng mong muốn cho bản dịch cuối cùng.

Nhìn chung, vai trò của con người trong quy trình MT là bổ sung (complement) và cải thiện khả năng của hệ thống MT, chứ không phải thay thế hoàn toàn. Mặc dù các hệ thống MT có thể đạt hiệu quả cao trong việc xử lý khối lượng lớn các tác vụ dịch thuật thông thường, nhưng chuyên môn của con người vẫn rất cần thiết đối với các tác vụ dịch thuật phức tạp hoặc tinh tế hơn (more complex or nuanced translation task) , hoặc khi có yêu cầu phải đạt độ chính xác hoặc chất lượng ở mức cao nhất.


Trên đây là phần trình bày tổng quan về dịch máy, trong đó chủ đề quan trọng nhất theo chúng tôi là Bộ nhớ dịch. Những bài tiếp theo chúng tôi sẽ đào sâu vào chủ đề này. Các bạn nhớ theo dõi trang web này để đọc tiếp, và nếu có trao đổi gì xin gửi vào phần comment hoặc gửi vào email của FLC tại nguonsang20202@gmail.com các bạn nhé!

Trả lời

Email của bạn sẽ không được hiển thị công khai.