SINH VIÊN NGHIÊN CỨU ỨNG DỤNG DỊCH MÁY ANH - VIỆT BẰNG PHƯƠNG PHÁP HỌC THỐNG KÊ

Thứ ba - 29/12/2020 04:41

Trong thời đại toàn cầu hóa, nhu cầu dịch thuật giữa các ngôn ngữ ngày càng trở nên quan trọng, đặc biệt là giữa tiếng Anh và tiếng Việt. Nhận thấy tiềm năng to lớn của dịch máy trong hỗ trợ giao tiếp và tiếp cận tri thức, nhóm sinh viên khoa Công nghệ Thông tin, Robot & Trí tuệ Nhân tạo, Trường Đại học Bình Dương đã thực hiện đề tài nghiên cứu khoa học “Xây dựng mô hình dịch máy Anh – Việt sử dụng phương pháp học thống kê” trong năm học 2019 - 2020.

Ứng dụng của dịch máy trong thời đại số

Dịch máy đã có những bước phát triển vượt bậc trong những năm gần đây, đặc biệt với sự ra đời của các phương pháp hiện đại như dịch máy thần kinh (Neural Machine Translation - NMT) và dịch máy thống kê (Statistical Machine Translation - SMT). Tuy nhiên, mỗi phương pháp đều có ưu điểm và hạn chế riêng. Đề tài nghiên cứu của nhóm sinh viên hướng đến việc ứng dụng phương pháp dịch máy thống kê nhằm cải thiện chất lượng dịch giữa tiếng Anh và tiếng Việt.

Dưới sự hướng dẫn của ThS. Huỳnh Quang Đức, nhóm nghiên cứu gồm các sinh viên Bùi Thiện Tâm và Võ Bá Học đã tiến hành tìm hiểu về xử lý ngôn ngữ tự nhiên (NLP), phân tích các phương pháp dịch máy và xây dựng hệ thống dịch thử nghiệm dựa trên tập dữ liệu song ngữ Anh - Việt.

Mục tiêu và nội dung nghiên cứu

Mục tiêu chính của đề tài là xây dựng một hệ thống có thể dịch từ tiếng Anh sang tiếng Việt với độ chính xác cao hơn so với các phương pháp dịch truyền thống. Để đạt được mục tiêu này, nhóm nghiên cứu đã triển khai các nội dung sau:

  • Tìm hiểu các mô hình dịch máy thống kê phổ biến như Word-based, Phrase-based, Syntax-based SMT.
  • Xây dựng tập dữ liệu song ngữ Anh - Việt phục vụ huấn luyện mô hình.
  • Ứng dụng các phương pháp đánh giá chất lượng bản dịch như BLEU, METEOR, TER để so sánh hiệu suất.
  • Đánh giá hiệu quả của phương pháp SMT so với các hệ thống dịch có sẵn hiện nay.

Khả năng ứng dụng thực tiễn

Với sự phát triển của trí tuệ nhân tạo và nhu cầu dịch thuật ngày càng cao, hệ thống dịch máy được xây dựng trong đề tài có tiềm năng ứng dụng trong nhiều lĩnh vực, bao gồm:

  • Hỗ trợ dịch tài liệu trong lĩnh vực học thuật, kinh tế, du lịch.
  • Cải thiện khả năng tiếp cận tri thức cho người dùng không thông thạo tiếng Anh.
  • Ứng dụng trong hệ thống chatbot, trợ lý ảo hỗ trợ giao tiếp song ngữ.

Kết quả nghiên cứu từ đề tài không chỉ giúp sinh viên có cái nhìn sâu hơn về lĩnh vực xử lý ngôn ngữ tự nhiên mà còn mở ra hướng phát triển mới trong ứng dụng dịch máy tại Việt Nam. Trong tương lai, nhóm nghiên cứu dự kiến sẽ tiếp tục cải tiến mô hình, áp dụng các phương pháp hiện đại hơn như dịch máy thần kinh (NMT) nhằm nâng cao độ chính xác và tính tự nhiên của bản dịch.

Đề tài này là một minh chứng rõ ràng cho sự sáng tạo và tinh thần nghiên cứu khoa học của sinh viên Trường Đại học Bình Dương, góp phần thúc đẩy sự phát triển của công nghệ xử lý ngôn ngữ tại Việt Nam.

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Icon-Zalo Zalo Icon-Messager Messenger Icon-Youtube Youtube Icon-Instagram Maps
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây