Câu chuyện công nghệ

Các trung tâm nghiên cứu của Samsung: Dẫn đầu trong công nghệ dịch thuật ứng dụng AI

SGGPO
Công nghệ dịch thuật ứng dụng trí tuệ nhân tạo (AI) của hãng điện tử Samsung đang liên tiếp đạt thành tích cao tại các cuộc thi toàn cầu và mới đây nhất, Viện nghiên cứu và phát triển Samsung tại Ba Lan và tại Bắc Kinh (Trung Quốc) thuộc Samsung Research đã tiếp tục giành chiến thắng tại Hội thảo quốc tế về dịch ngôn ngữ nói (IWSLT)… 

Các thành viên của Nhóm Nghiên cứu thuộc Viện R&D Samsung Ba Lan tham dự IWSLT năm nay

Các thành viên của Nhóm Nghiên cứu thuộc Viện R&D Samsung Ba Lan tham dự IWSLT năm nay

AI dịch giọng nói

Vừa qua, Viện nghiên cứu và phát triển (R&D) của Samsung tại Ba Lan và Trung Quốc đã thi đấu với một số trường đại học và một số phòng thí nghiệm hàng đầu thế giới, đã xuất sắc giành chiến thắng một trong hai thử thách tại Hội thảo Quốc tế về Dịch Ngôn ngữ Nói (IWSLT).

Với thử thách “Dịch giọng nói offline” (Offline Speech Translation) trong bài phát biểu TED từ tiếng Anh sang tiếng Đức, Viện R&D của Samsung Ba Lan đã giành được vị trí đầu bảng nhờ vào khả năng nghiên cứu về quá trình dịch từ âm thanh sang văn bản. Sự kiện này đã đánh dấu 4 năm liên tiếp các nhóm nghiên cứu đến từ Viện R&D của Samsung Ba Lan đã giành giải nhất trong các thử thách IWSLT, bao gồm các nhiệm vụ dịch văn bản của những năm trước.

Các trung tâm nghiên cứu của Samsung: Dẫn đầu trong công nghệ dịch thuật ứng dụng AI ảnh 1 Các thành viên của Nhóm nghiên cứu thuộc Viện R&D Samsung tại Bắc Kinh, Trung Quốc tham dự IWSLT

Cụ thể, nhiệm vụ Dịch giọng nói offline năm nay cho phép người tham gia gửi các cơ chế dựa trên hệ thống dịch giọng nói truyền thống bao gồm nhận dạng giọng nói tự động (ASR) và dịch máy (MT) hoặc cơ chế mã hóa End-to-End (E2E). Ở nhiệm vụ này, viện nghiên cứu và phát triển Samsung tại Ba Lan đã sử dụng hệ thống "E2E" để dịch trực tiếp từ nguồn âm thanh, giảm thiểu lỗi dịch có thể phát sinh khi qua nhiều công đoạn xử lý.

Phía Samsung cho biết hệ thống dịch E2E mới được phát triển chưa đầy ba năm nhưng Viện nghiên cứu và phát triển Samsung tại Ba Lan đã gặt hái được thành quả vượt trội hơn phương thức truyền thống. Đây là một thành tích quan trọng, giúp Viện R&D của Samsung Ba Lan dẫn đầu trong nghiên cứu dịch giọng nói.

Ngôn ngữ học tính toán AI

Trong khi đó, Viện R&D Samsung tại Bắc Kinh (Trung Quốc) lại chiến thắng thử thách “Dịch Open Domain”, đánh giá khả năng dịch từ tiếng Nhật sang tiếng Trung. Mục tiêu của hạng mục này là thúc đẩy nghiên cứu về dịch thuật giữa các ngôn ngữ châu Á. Phương thức viện nghiên cứu này lựa chọn là chú ý tương quan (Relative Position Attention), nâng cao độ chính xác khi dịch dựa trên nền tảng từ vựng sử dụng chung trong tiếng Nhật và tiếng Trung Quốc.

Các trung tâm nghiên cứu của Samsung: Dẫn đầu trong công nghệ dịch thuật ứng dụng AI ảnh 2 Các thành viên của Nhóm Nghiên cứu thuộc Viện R&D Samsung Ba Lan tham dự DCASE 
Ngoài việc giành chiến thắng trong thử thách IWSLT, Viện R&D Samsung Ba Lan còn được công nhận là một trong những nhóm dẫn đầu ở thử thách Phát hiện và Phân loại các Cảnh và Sự kiện Âm thanh (DCASE) 2020, tổ chức bởi Viện Điện và Kỹ sư Điện tử (IEEE), nhằm thúc đẩy việc sử dụng công nghệ AI để hiểu và diễn giải các tín hiệu âm thanh.

Theo các kỹ sư đến từ Viện R&D Samsung Ba Lan, thách thức ở đây nằm ở việc phải phát hiện ra những âm thanh bất thường trong điều kiện và dữ liệu chỉ được cung cấp cho những âm thanh bình thường. Kết quả, nhóm kỹ sư của Samsung đã đạt vị trí thứ hai trong số 40 nhóm.

Phiên dịch tín hiệu âm thanh bằng AI

Trước đó vào tháng 6, Viện R&D Samsung Bắc Kinh cũng đã tham gia vào ba thử thách được tổ chức bởi Hội nghị về Thị giác và Nhận dạng Mẫu máy tính năm 2020 (CVPR 2020): Embodied AI Challenge (Thử thách AI thể nghiệm), thử thách dựng phụ đề cho ứng dụng VizWiz và Thử thách dựng phụ đề video trên VATEX. Chung cuộc, nhóm đã giành vị trí thứ hai trong các thử thách này.

Các trung tâm nghiên cứu của Samsung: Dẫn đầu trong công nghệ dịch thuật ứng dụng AI ảnh 3 Các thành viên của Nhóm nghiên cứu thuộc Viện R&D Samsung Bắc Kinh tham dự CVPR

Nếu như thử thách AI Thể Nghiệm cho phép rô-bốt hiểu được lệnh từ con người và thực hiện các hành động chính xác trong môi trường ảo, thì Thử thách phụ đề cho ứng dụng VizWiz liên quan đến việc dự đoán chính xác nội dung của một người khiếm thị đang diễn tả hình ảnh, và Thử thách phụ đề video VATEX là đánh giá tiến độ chuẩn đối với các mô hình mà được mô tả qua video bằng nhiều ngôn ngữ khác nhau, bao gồm tiếng Anh và tiếng Trung.

KIM THANH

Tin cùng chuyên mục