Công nghệ chuyển giọng nói... thành chữ viết
Nhân viên của ETRI kiểm tra công nghệ nhận dạng tiếng nói của mình bằng ứng dụng dịch thuật di động Genie Talk ngày 18/4. Ảnh: ETRI |
Các nhà nghiên cứu của ETRI đã ứng dụng công nghệ nhận diện chuyên sâu (deep learning) của trí tuệ nhân tạo để phát triển một chương trình nhận diện-dịch thuật âm thanh đa ngôn ngữ.
Theo đó, với các cụm từ có sẵn, công nghệ sẽ nhận diện âm thanh giọng nói để dịch trực tiếp từ ngôn ngữ này sang ngôn ngữ khác rồi hiển thị nội dung đó bằng chữ viết.
So với chương trình của Google, khả năng nhận diện tiếng Hàn của ETRI vượt trội hơn khi có thể "dịch" tới 96% nội dung cuộc nói chuyện trong đời sống hằng ngày. Tỉ lệ này ở các ngôn ngữ khác đạt từ 90% tới 95%, tương đương với Google.
Hiện công nghệ trên đã được áp dụng với 9 ngôn ngữ, gồm tiếng Anh, Trung Quốc, Nhật, Tây Ban Nha, Pháp, Đức, Nga và tiếng A Rập.
ETRI dự kiến sẽ mở rộng áp dụng với một số ngôn ngữ ở Đông Nam Á.
Tạp chí điện tử Hoà Nhập, cơ quan ngôn luận của Hiệp hội Doanh nghiệp của Thương binh và NKT Việt Nam, liên tục cập nhật thông tin liên quan về lĩnh vực kinh doanh của Thương binh và Người khuyết tật như: Đầu tư, kinh doanh, thương mại, dịch vụ, bất động sản, sức khỏe. Ngoài ra, Tạp chí cũng xin giới thiệu tới độc giả những bài viết về chính sách cho người có công, tấm gương thương binh, người khuyết tật vượt khó, doanh nhân thương binh, người khuyết tật tiêu biểu, doanh nghiệp của thương binh và người khuyết tật. Kính mời độc giả đón đọc. Mọi ý kiến đóng góp và chia sẻ xin liên hệ qua email tapchihoanhap@gmail.com.