Máy móc hiểu con người mà không cần nghe giọng nói
Hai nghiên cứu đã chứng minh máy móc có thể hiểu những gì con người nói mà không cần nghe giọng nói của họ.
![]() |
Trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi. Ảnh: MIT Technology Review. |
Hiểu từ ngữ từ cách ra hiệu môi là một bài toán khó,áymóchiểuconngườimàkhôngcầnnghegiọngnóxếp hạng pháp phụ thuộc hoàn cảnh và khả năng thông hiểu ngôn ngữ thông qua tín hiệu thị giác. Tuy nhiên, các nhà nghiên cứu đã chứng minh rằng máy móc có thể nhận dạng ngôn ngữ từ một đoạn video câm tốt hơn cả những người hiểu cách ra hiệu môi chuyên nghiệp.
Nhóm nghiên cứu thuộc ngành Khoa học máy tính của đại học Oxford đã phát triển hệ thống trí tuệ nhân tạo mang tên LipNet. Hệ thống được xây dựng trên cơ sở dữ liệu GRID, tạo nên từ một loạt clip trực tiếp về những người đang đọc các mẫu câu đơn giản.
Nhóm đã sử dụng dữ liệu này để phát triển một hệ thống nơ-ron công nghệ nhận diện ngôn ngữ. Dù hệ thống nhận diện sai lệch từ ngữ nhiều lần, quá trình học nhằm liên kết thông tin đến giải thích những gì đang được nói đã diễn ra, bởi lẽ tín hiệu môi luôn ít hơn số âm thanh mà chúng thể hiện.
Từ đây, máy móc bắt đầu xem xét toàn bộ đoạn video, phát triển khả năng hiểu đoạn văn từ các câu được phân tích.
Khi thử nghiệm, hệ thống có thể nhận diện chính xác đến 93,4%. Trong khi đó, những tình nguyện viên được yêu cầu đọc tín hiệu môi trong bài tập này đoán đúng chỉ 52,3% số từ.
Bên cạnh đó, theo tờ New Scientist, một nhóm khác thuộc ngành Khoa học kĩ thuật của đại học Oxford, làm việc với Google DeepMind, đã nghiên cứu vấn đề với một bài tập khó hơn về ngôn ngữ. Thay vì dùng cơ sở dữ liệu đơn giản và nhất quán như GRID, nhóm này dùng đến 100.000 video ở cấp độ từ ngữ rộng và phát âm phức tạp từ đài BBC.
Với phương pháp tương tự, nhóm từ Oxford và DeepMind đã xây dựng một cỗ máy với khả năng nhận diện đúng 46,8% tất cả từ ngữ. Kết quả này cho thấy chúng hoạt động tốt hơn cả con người với chỉ 12,4% từ đúng.
Gác lại những khác biệt, cả hai thí nghiệm chứng tỏ trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi, và không lâu nữa, chúng ta rồi sẽ chứng kiến những ứng dụng đầy tiềm năng cho lĩnh vực này.
Trong tương lai, biết đâu Skype cũng sẽ áp dụng chúng bằng cách ghi lại lời thoại, khi người gọi đang ở một chốn ồn ào, hoặc người nghe gặp khó khăn để giữ smartphone và lắng nghe trọn vẹn đầu dây bên kia?
Theo Zing/New Scientist
-
Nhận định, soi kèo Basel vs Grasshoppers, 1h30 ngày 4/4: Lên đỉnh bảngCEO Base.vn: Startup phải tăng trưởng kể cả khi không có tiền đầu tư4 tính năng được trông chờ nhất trên Samsung Galaxy Note 9Màn hình HP EliteDisplay E233: Cho văn phòng hiện đạiNhận định, soi kèo Petrocub Hincesti vs Milsami, 22h00 ngày 3/4: Đánh mất lợi thếFord EcoSport 2018 “hạ chốt” ngày ghé thăm Việt NamChỉ vài giọt mực, anh chàng biến nước thành chữ như có phép màuCuộc sống bí ẩn và đầy căng thẳng của các kiểm duyệt viên Facebook tại MỹNhận định, soi kèo Universitario Deportes vs River Plate, 07h30 ngày 3/4:Một Redditor phải bỏ gần 2,5 triệu đồng mua skin Overwatch League vì thua ‘độ’
下一篇:Nhận định, soi kèo Difai Agsu FK vs Karvan FK, 19h00 ngày 3/4: Sáng cửa dưới
- ·Nhận định, soi kèo Nữ Úc vs Nữ Hàn Quốc, 16h00 ngày 4/4: Không hề ngon ăn
- ·Samsung xởi lởi cho quà, VĐV Triều Tiên không được nhận Galaxy Note 8
- ·Galaxy S7 Edge ở VN bất ngờ được cập nhật Android Oreo trước Galaxy S8
- ·10 clip 'nóng': Nữ cảnh sát hạ gục toán cướp sau cuộc đấu súng
- ·Nhận định, soi kèo Olimpija vs Beltinci, 21h00 ngày 3/4: Cửa trên đáng tin
- ·LMHT: PawN thấy nhẹ nhõm khi đánh bại SKT, cam kết đánh bại cả KSV lẫn KZ
- ·LMHT: KSV lý giải nguyên nhân thắng ngược Afreeca dù Nhà Chính chỉ còn 31 máu
- ·Facebook, YouTube có thể chặn video bạo lực nhờ công nghệ này
- ·Nhận định, soi kèo Shanghai Port vs Meizhou Hakka, 19h00 ngày 2/4: Bữa tiệc bàn thắng
- ·CEO Tập đoàn Yeah1: Hai tuần nữa mới có thoả thuận chính thức từ Youtube về MCN
- ·Triệu hồi hơn 200 mô tô phân khối lớn Kawasaki ZR900 tại Việt Nam
- ·Đừng dùng AnTuTu Benchmark để đánh giá hiệu năng iPhone
- ·Siêu máy tính dự đoán Chelsea vs Tottenham, 2h00 ngày 4/4
- ·Xiaomi lộ diện công nghệ sạc đầy pin 4.000 mAh trong 17 phút
- ·Bộ GD&ĐT công bố các kênh hỗ trợ thông tin về thi và tuyển sinh 2019
- ·Startup mua sắm được hoàn tiền ShopBack nhận thêm 45 triệu USD đầu tư
- ·Nhận định, soi kèo Eintracht Braunschweig vs Paderborn, 23h30 ngày 4/4: Ca khúc khải hoàn
- ·Bùi Tiến Dũng sẽ quyết định số phận của U23 Việt Nam?
- ·Sau 4 năm ở Burundi, lợi nhuận của Viettel tăng trưởng tới 225% và chiếm 54% thị phần
- ·Denuvo thế hệ mới đã bị đánh bại, Assassin's Creed: Origins chính thức thất thủ
- ·Soi kèo phạt góc Newcastle vs Brentford, 1h45 ngày 3/4
- ·Hàng loạt nhân vật hoạt hình bỗng xâm chiếm Tokyo sau đợt tuyết rơi dày nhất trong 4 năm qua
- ·Youtube tắt kiếm tiền kênh Khá Bảnh, những kênh có nội dung tương tự vẫn ngang nhiên hốt bạc
- ·Thứ trưởng Nguyễn Thành Hưng: Các vụ lây nhiễm mã độc và tấn công mạng đã giảm rõ rệt
- ·Nhận định, soi kèo Varazdin vs HNK Gorica, 23h00 ngày 4/4: Chủ nhà sa sút
- ·Tivi thương hiệu Việt giá bình dân thêm một đối thủ cạnh tranh
- ·Nhận định, soi kèo Stal Mielec vs Cracovia Krakow, 23h00 ngày 4/4: Khó cho chủ nhà
- ·Người Trung Quốc thờ ơ với sự kiện của Apple: 'Mấy thứ đấy chúng tôi có hết rồi!'
- ·Mỹ tiếp tục ngăn chặn Huawei, ủng hộ tiêu chuẩn 5G của Đức
- ·Khám phá 'tổng hành dinh' Gaming Center của Team Liquid
- ·Nhận định, soi kèo Central Cordoba vs LDU Quito, 5h00 ngày 4/4: Chủ nhà sa sút
- ·Hết Vuivui đến Robins.vn đóng cửa, thị trường thương mại điện tử Việt Nam khốc liệt ra sao?
- ·Hai tựa game PUBG Mobile lọt top tải về trên iOS, thu hút hơn 75 triệu lượt đăng ký trước
- ·Nhóm côn đồ tán loạn khi người phụ nữ rút súng
- ·Nhận định, soi kèo Trabzonspor vs Bodrum, 21h45 ngày 2/4: Vé cho chủ nhà
- ·ASUS phủ nhận thông tin hơn 1 triệu máy tính bị cài mã độc