«Сбер» представил нейросеть, создающую изображения по словесному описанию


«Сбер» разработал нейросеть под названием ruDALL-E для создания иллюстраций. Уникальностью новой технологии является то, что искусственный интеллект использует в своей работе слова на русском языке.

Для создания изображений отсутствует лимит, компьютер обучается параллельно на картинках и текстах.

Разработка включает в себя три нейросети. Первая занимается обработкой текста и определением количества возможных изображений, вторая — отсеиванием лучших. Третья нейросеть увеличивает картинки в размере с сохранением качества.

Представители «Сбера» подчеркнули, что на обучение нейросети потребовалось 23 000 GPU-часов, и данный процесс стал самым крупным нейросетевым вычислительным проектом на территориях РФ и СНГ.

Модель ruDALL-E XL с 1,3 миллиарда параметров находится в открытом доступе на GitHub. Было отмечено, что имеется аналог — ruDALL-E 12B. Он обладает 12 миллиардами параметров. Обе системы в скором времени будут доступны на площадке ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.

Подписка на FBM.RU в Telegram - удобный способ быть в курсе важных экономических новостей! Подписывайтесь и будьте в центре событий. Подписаться.

Добавьте FBM.ru в избранные новости Добавьте FBM в избранные новости

Оценить новость
( 2 оценки, среднее 3 из 5 )
Дмитрий Корнилов/ автор статьи
FBM.ru - Финансы  Бизнес Маркетинг