Система искусственного интеллекта DeepMind, разработанная научными сотрудниками Google и Оксфордского университета, обошла человека в чтении по губам.
У экспертов коэффициент точности распознавания составляет 12,4%, у машины – 46,8%. Отмечается, что система совершала незначительные ошибки, но они не мешали общему восприятию текста.
В процессе обучения DeepMind было показано 5000 часов видео BBC на английском языке, которые содержали 118 тысяч предложений.
Учёные считают, что система может использоваться в мобильных технологиях и виртуальных ассистентах. Она также может помочь людям с проблемами слуха понимать других.
Напомним, что специалисты Microsoft разработали технологию, которая способна распознавать разговорную речь так же хорошо, как человек.
Комментарии