Как сообщает ТАСС, российские психолингвисты обнаружили, что при чтении люди могут предсказывать не только конкретные слова, но и грамматические признаки слов. С помощью этого они способны читать гораздо быстрее. Об этом рассказали в пресс-службе НИУ ВШЭ со ссылкой на статью в издании PLOS ONE.
Анастасия Лопухина, один из авторов работы, научный сотрудник Центра языка и мозга НИУ ВШЭ рассказала, что в этом проекте было важно выяснить один вопрос: действительно ли читающие носители языков с богатой морфологией активно задействуют грамматическое предсказание. Также специалистов заинтересовало то, что они получили возможность оценивать вероятность слов благодаря нашей языковой модели.
Ученые полагают, что многие люди очень быстро читают именно с помощью того, что их мозг постоянно пытается предугадать, какие слова могут встретиться в читаемой конструкции. Благодаря этому мозг быстрее обрабатывает поступающую информацию, если она хотя бы частично совпадает с представлениями человека.
Недавно ученые нашли намеки на то, что в подобных предсказаниях мозг может использовать не только конкретные слова, но и сведения об их отдельных признаках, например, к какой части речи они относятся. Лопухина и ее коллеги проверили, характерна ли такая особенность и для русского языка.
Для эксперимента специалисты подготовили 144 предложения, из каждого из которых удалили одно слово. Перед добровольцами стояла задача угадать это слово, а ученые пытались предсказать вероятность этого благодаря двум разным теоретическим моделям и нейросети, которая произведена на основе одной из них.
Собрав группу из шести сотен участников, ученые попросили их заполнить пропуски в грамматических конструкциях, после чего провели анализ собранных ответов, учитывая как различия в выборе слов, так и их характеристики. Выяснилось, что точно угадать слово люди могут примерно в 18% случаев.
Часть речи и морфологические признаки слов участники эксперимента угадывали гораздо чаще – от 63 до 78%. Нейросеть, обученная на Национальном корпусе русского языка, угадывала пропущенные слова и определяла их грамматические характеристики почти так же хорошо, как и участники эксперимента.
Наблюдения за движением глаз добровольцев во время чтения свидетельствовали, что скорость усвоения информации зависела от того, насколько хорошо участники опытов угадывали части речи, род и число существительных и другие грамматические характеристики пропущенных слов во время первой части работы.
В результате специалисты пришли к выводу, что для языков с богатой морфологией, к которым относится русский, предсказание в большой степени связано с предугадыванием грамматических признаков слова. Высокий уровень успеха нейросети в этом отношении дал понять, что ее можно применять для получения данных, которые раньше генерировались “вручную”, в ходе наблюдений за читающими людьми.
Ученые выражают надежду, что использование нейросетей ускорит исследования способностей чтения. Также они помогут понять, различаются ли в этом плане носители разных языков, и определить, как можно увеличить скорость восприятия письменной речи.