У специалистов получилось повысить эффективность обучения нейросети StyleGAN2 для генерации картинок. Об этом пишет пресс-служба НИУ ВШЭ.
Нынешние нейросети умеют генерировать фальшивые картинки, практически неотличимые от настоящих. Это также касается лиц никогда не живших людей. Самыми успешными типами нейросетей для таких задач являются генеративно-состязательные сети — один алгоритм генерирует картинку, а другой пытается отличить его от настоящего. В конечном счёте картинка приобретает такой вид, чтоб различия стали минимальными.
Сложность при эксплуатации этой схемы – сбор большого количества хороших и качественных картинок для обучения. Есть способы, позволяющие частично обойти это.
В Центре глубинного обучения и байесовских методов НИУ ВШЭ совместно с AIRI поведали о новом подходе к дообучению генеративной модели StyleGAN2. Это генеративная нейросеть, преобразующая случайный шум в настоящую картинку. Исследователи оптимизировали её обучение, уменьшив количество обучаемых параметров на четыре порядка за счёт обучения дополнительного доменного вектора.
«Это заметно уменьшает число оптимизируемых параметров, поскольку размерность такого доменного вектора всего 6 000, что на порядки меньше, чем 30 млн весов нашего генератора», — объяснил один из исследователей Айбек Аланов
.