«Сбер» разработал нейросеть под названием ruDALL-E для создания иллюстраций. Уникальностью новой технологии является то, что искусственный интеллект использует в своей работе слова на русском языке.
Для создания изображений отсутствует лимит, компьютер обучается параллельно на картинках и текстах.
Разработка включает в себя три нейросети. Первая занимается обработкой текста и определением количества возможных изображений, вторая — отсеиванием лучших. Третья нейросеть увеличивает картинки в размере с сохранением качества.
Представители «Сбера» подчеркнули, что на обучение нейросети потребовалось 23 000 GPU-часов, и данный процесс стал самым крупным нейросетевым вычислительным проектом на территориях РФ и СНГ.
Модель ruDALL-E XL с 1,3 миллиарда параметров находится в открытом доступе на GitHub. Было отмечено, что имеется аналог — ruDALL-E 12B. Он обладает 12 миллиардами параметров. Обе системы в скором времени будут доступны на площадке ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.