Google разработала самую точную нейросеть для создания картинок по текстовому описанию


Не так давно OpenAI презентовала второе поколение нейросети DALL-E, которая предназначена для создания изображений на основе текстового описания. Теперь следом и Google представила свой похожий проект, который получил название Imagen.

Представители американской корпорации сообщили о том, что для распознавания текстового запроса в нейросети используются большие языковые модели. Причем алгоритмы нейронной сети улучшают получившуюся схематичную картинку размером 64 × 64 сначала до 256 х 256, а далее и до 1024 × 1024.

В течение этого времени модель не просто апскейлит картинку, а тщательно дорисовывает имеющиеся детали на изображении.

Разработчики Imagen сравнили свой продукт с DALL-E 2 от OpenAI. Они сообщили, что тестировщики чаще выбирали картинки, которые были созданы их технологией, когда их просили отдать предпочтение более точному и достоверному изображению.

В настоящее время проект работает в режиме закрытой беты. Доступ к ней могут получить только некоторые лица. Причиной этого авторы работы назвали страх за использование нейросети для создания неприемлемых изображений.

Добавьте FBM.ru в избранные новости Добавьте FBM в избранные новости

Оценить новость
( Пока оценок нет )
Дмитрий Корнилов/ автор статьи
FBM.ru - Финансы  Бизнес Маркетинг