В Имперском колледже Лондона обучили компьютер распознавать речь по губам на разных языках

Научным материалом поделился журнал Nature Machine Intelligence. Согласно имеющимся сведениям, доктор философии и автор работы Пинчуань Ма и его коллеги научили искусственный интеллект распознавать речь на языках, отличных от английского, по движениям губ говорящих.

Позднее они провели сравнение производительности с другими решениями, которые обучены распознавать речь на английском языке. Также было отмечено, что ключевой инновацией оказалось обучение модели выполнению VSR при добавлении ряда дополнительных способов увеличения данных и функции потери.

«Мы добились самых современных результатов на нескольких языках благодаря тщательному проектированию модели, а не просто использованию больших наборов данных или больших моделей», — прокомментировал специалист.

Со слов учёного, их работа может вдохновить других исследователей на создание альтернативных моделей VSR, которые будут эффективно распознавать речь по движениям губ на языках, которые отличны от английского.

В планах Ма и его группы ученых провести научную работу по комбинированию моделей VSR с аудио-распознаванием речи.

Подписка на FBM.RU в Telegram - удобный способ быть в курсе важных экономических новостей! Подписывайтесь и будьте в центре событий. Подписаться.

Добавьте FBM.ru в избранные новости Добавьте FBM в избранные новости

Астронавты зафиксировали мощную звуковую волну от столкновения галактик, дошедшую до Земли

Какой кофе ускоряет старение: ученые раскрыли неожиданные данные

Отсыпайтесь в выходные: ученые доказали пользу этой простой привычки

Ученые выяснили, как ранний отход ко сну влияет на здоровье кишечника