Huawei разработала нейросеть PixArt-Σ для создания 4K изображений по текстовому запросу
Представленная нейросеть обеспечивает улучшенное качество генерации изображений и высокую точность моделирования
Одно из подразделений китайской компании Huawei представило новую нейросеть PixArt-Σ (Sigma), способную генерировать изображения в разрешении 4K по текстовому запросу. Эта модель, основанная на предыдущих разработках PixArt-α (Alpha) и PixArt-δ (Delta), отличается улучшенным качеством изображений, точностью генерации и эффективной обработкой данных. Информацию об этом опубликовал The decoder.
PixArt-Σ способна создавать изображения размером до 3840×2560 пикселей без промежуточного масштабирования, даже при выборе пользователем нестандартного соотношения сторон. В отличие от предыдущих моделей PixArt, которые могли генерировать изображения только до 1024×1024 пикселей.
Увеличение разрешения изображений требует значительных вычислительных ресурсов, и разработчики компенсируют это с помощью стратегии обучения «от слабого к сильному». Она включает в себя специальные методы тонкой настройки, обеспечивающие эффективный переход от простых этапов к более сложным.
Среди методов, использованных при разработке нейросети, можно отметить более мощный автокодировщик переменных, масштабирование разрешения изображений и переход к модели с сжатием ключевых значений, фокусирующейся на важных аспектах изображения.
Разработчики также представили изображения, созданные с помощью нейросети PixArt-Σ и других моделей.
В прошлом году наблюдался значительный рост аудитории нейросетей в России, увеличившейся в 3,5 раза. Отмечается, что мужчины чаще женщин пользуются сервисами на основе искусственного интеллекта.