Google разработала самую точную нейросеть для создания картинок по текстовому описанию

Не так давно OpenAI презентовала второе поколение нейросети DALL-E, которая предназначена для создания изображений на основе текстового описания. Теперь следом и Google представила свой похожий проект, который получил название Imagen.

Представители американской корпорации сообщили о том, что для распознавания текстового запроса в нейросети используются большие языковые модели. Причем алгоритмы нейронной сети улучшают получившуюся схематичную картинку размером 64 × 64 сначала до 256 х 256, а далее и до 1024 × 1024.

В течение этого времени модель не просто апскейлит картинку, а тщательно дорисовывает имеющиеся детали на изображении.

Разработчики Imagen сравнили свой продукт с DALL-E 2 от OpenAI. Они сообщили, что тестировщики чаще выбирали картинки, которые были созданы их технологией, когда их просили отдать предпочтение более точному и достоверному изображению.

В настоящее время проект работает в режиме закрытой беты. Доступ к ней могут получить только некоторые лица. Причиной этого авторы работы назвали страх за использование нейросети для создания неприемлемых изображений.

Подписка на FBM.RU в Telegram - удобный способ быть в курсе важных экономических новостей! Подписывайтесь и будьте в центре событий. Подписаться.

Добавьте FBM.ru в избранные новости Добавьте FBM в избранные новости

В Москве пройдет Технологическая неделя: The Trends Forum и Mining.RU соберут лидеров инноваций и инвестиций

Евразийская Неделя Маркетинга в Москве: новые идеи, тренды и лучшие кейсы

Global Tech Forum: как ИИ меняет бизнес и открывает новые профессии

Trendsetters: как Media 4.0 меняет правила игры в медиаиндустрии