Учеными из Лос-Аламосской национальной лаборатории создан новый тип нейронной сети, которая преодолевает проблему “бесплодного плато”, не позволяющего обучить программу. Такая сеть может быть запущена на квантовом компьютере. Исследование опубликовано в журнале Physical Review X.
Суть проблемы “бесплодного плато” заключается в исчезающем градиенте в ландшафте оптимизации, состоящем из холмов и долин, высота которых отражает “сложность” пути решения задачи. Самый оптимальный путь обычно находится на дне низкой долины. Но если ландшафт плоский, он не позволяет обучать параметры, так как невозможно определить, в каком направлении двигаться для улучшения решения.
При увеличении количество характеристик данных эта проблема становится особенно актуальной. Фактически, ландшафт имеет тенденцию становиться плоским по закону экспоненты по мере увеличения размера сети. Следовательно, при наличии такого “бесплодного плато” квантовая нейронная сеть не может быть масштабирована.
Специалисты показали, что определенный дизайн конволюционной нейронной сети позволяет избежать проблемы стерильного плато при ее масштабировании.
Квантовые конволюционные нейронные сети основаны на структуре зрительной коры головного мозга. Они включают в себя ряд сверточных слоев, или фильтров, чередующихся с ассоциативными слоями, которые уменьшают размер хранимой информации, сохраняя при этом важные функции набора данных.
Эти нейронные сети могут использоваться для решения целого ряда задач, от распознавания изображений до обнаружения материалов. Преодоление бесплодных плато является ключом к раскрытию всего потенциала квантовых компьютеров в приложениях искусственного интеллекта и демонстрации их превосходства над классическими компьютерами.
Новый тип квантовой сверточной нейронной сети, надежность которой уже доказана исследованиями, по мнению ученых, найдет полезное применение в анализе данных квантового моделирования. Благодаря сети можно просеивать большой набор данных о различных состояниях материала и сопоставлять эти состояния с фазами для определения оптимальной внутренней структуры вещества, например, для возникновения высокотемпературной сверхпроводимости.