Команда ВКонтакте представила автоматическую расшифровку видеосообщений в VK Мессенджере.
Технология расшифровки полностью автоматизирована и работает на основе методов машинного обучения, разработанных соцсетью ВКонтакте. Для высокой точности расшифровки видеозаписи обрабатываются тремя нейросетями: они распознают звуки, отделяя их от видеоряда, формируют из звуков слова и определяют границы предложений.
Распознавание речи полностью автоматизировано и происходит без участия человека. Технология обучается на субтитрах фильмов и способна понимать неразборчивую речь и неформальную лексику, убирать паузы из записи, разбивать текст на предложения и смысловые блоки.
Расшифровывать можно как полученные, так и отправленные видеосообщения. Достаточно нажать на значок «Аа», после чего искусственный интеллект распознает речь собеседника и преобразует ее в текст. Инструмент будет полезен, когда неудобно слушать или смотреть видеосообщение. Кроме того, он позволит вернуться к нужной информации в переписке: расшифрованные видеосообщения можно находить при помощи поиска по тексту.
Функция уже доступна в веб-версии web.vk.me и части пользователей приложений ВКонтакте и VK Мессенджер на Android, в том числе в учебном профиле Сферум. Скоро она появится на iOS.
Напомним, в 2020 году ВКонтакте запустила технологию распознавания аудиосообщений. Это сразу вызвало рост аудитории, которая пользуется голосовыми — сейчас она составляет 33 млн человек в месяц. В среднем каждый пользователь сервиса читает 8 расшифровок в день.
Комментарии