2024-03-13

Huawei разработала нейросеть PixArt-Σ для создания 4K изображений по текстовому запросу

Представленная нейросеть обеспечивает улучшенное качество генерации изображений и высокую точность моделирования

Одно из подразделений китайской компании Huawei представило новую нейросеть PixArt-Σ (Sigma), способную генерировать изображения в разрешении 4K по текстовому запросу. Эта модель, основанная на предыдущих разработках PixArt-α (Alpha) и PixArt-δ (Delta), отличается улучшенным качеством изображений, точностью генерации и эффективной обработкой данных. Информацию об этом опубликовал The decoder.

PixArt-Σ способна создавать изображения размером до 3840×2560 пикселей без промежуточного масштабирования, даже при выборе пользователем нестандартного соотношения сторон. В отличие от предыдущих моделей PixArt, которые могли генерировать изображения только до 1024×1024 пикселей.

Увеличение разрешения изображений требует значительных вычислительных ресурсов, и разработчики компенсируют это с помощью стратегии обучения «от слабого к сильному». Она включает в себя специальные методы тонкой настройки, обеспечивающие эффективный переход от простых этапов к более сложным.

Среди методов, использованных при разработке нейросети, можно отметить более мощный автокодировщик переменных, масштабирование разрешения изображений и переход к модели с сжатием ключевых значений, фокусирующейся на важных аспектах изображения.

Разработчики также представили изображения, созданные с помощью нейросети PixArt-Σ и других моделей.

В прошлом году наблюдался значительный рост аудитории нейросетей в России, увеличившейся в 3,5 раза. Отмечается, что мужчины чаще женщин пользуются сервисами на основе искусственного интеллекта.

Добро пожаловать на страницу новостей Go495, где вы можете быть в курсе последних событий и интересных новостей от нашей компании. Являясь ведущим поставщиком цифровых решений, мы постоянно внедряем инновации и расширяем наши предложения, чтобы лучше обслуживать наших клиентов и оставаться в авангарде отрасли.

Huawei представила нейросеть PixArt-Σ, способную создавать 4K изображения по текстовому запросу. Она базируется на разработках PixArt-α и PixArt-δ, обладает улучшенным качеством и точностью. Модель генерирует изображения до 3840×2560 пикселей без масштабирования, используя стратегию обучения «от слабого к сильному». Разработчики внедрили новые методы, такие как автокодировщик и сжатие ключевых значений. Аудитория нейросетей в России растет, среди пользователей преобладают мужчины.