Социальная сеть “Вконтакте” предоставила доступ разработчикам инди-проектов к своей технологии, которая считывает голос и трансформирует его в текст (ASR, Automatic Speech Recognition).
Данную технологию можно протестировать через веб-интерфейс на специальной странице или же интегрировать через публичный API соцсети. Также для разработчиков открыли доступ к широкому набору методов, при помощи которых можно создавать мини-приложения “ВКонтакте” или использовать в сторонних проектах.
ASR используется социальной сетью для расшифровки аудио сообщений, создания субтитров в видеороликах, персональных рекомендаций и всего прочего. Технология использует сразу три нейронные сети: одна отвечает за распознавание речи, вторая занимается поиском подходящих слов, а третья расставляет знаки препинания.
