Stability AI начинает свой путь к искуплению
После неудачи с моделью SD3 Medium, компания Stability AI возвращается в игру, представив две новые модели, о которых было обещано рассказать ещё в июле: Stable Diffusion 3.5 Large и Stable Diffusion 3.5 Large Turbo.
"В июне мы выпустили Stable Diffusion 3 Medium – первую открытую модель из серии Stable Diffusion 3. К сожалению, она не совсем соответствовала нашим стандартам и ожиданиям сообщества," – сообщили в Stability в официальном блоге. "Прислушавшись к ценному отзыву нашего сообщества, мы не стали искать быстрое решение, а взяли время для дальнейшей разработки версии, которая продвинет нашу миссию трансформации визуальных медиа".
Мы сгенерировали несколько изображений для пробной проверки перед написанием этой эксклюзивной новости – и результаты действительно впечатляют, особенно для базовой модели.
Семейство SD 3.5 разработано таким образом, чтобы функционировать на потребительском уровне систем, даже на достаточно слабых по нынешним меркам, делая продвинутое создание изображений более доступным, чем когда-либо. И да, они услышали жалобы на предыдущую версию, так что эта обещает быть намного лучше. На столько лучше, что на выставочном изображении изображена женщина, лежащая на траве, что является остроумной ссылкой на предыдущие неудачи при решении подобных задач.
Ещё одним важным аспектом этого выпуска является новая модель лицензирования. Stable Diffusion 3.5 поставляется с более свободной лицензией, позволяя как коммерческое, так и некоммерческое использование. Малые предприятия и люди, зарабатывающие менее 1 000 000 долларов от инструмента, могут использовать и разрабатывать эти модели бесплатно.
Те, у кого доходы больше, должны связаться с Stability для обсуждения платежей. Для сравнения, Black Forest Labs предлагает свою более простую модель Flux Schnell бесплатно, его среднюю модель Flux Dev – бесплатно для некоммерческого использования, а его модель SOTA Flux Pro – закрытую модель.
Что в ассортименте у Stable Diffusion 3.5?
Stability AI выпускает три версии Stable Diffusion 3.5, каждая из которых предназначена для разных нужд:
- Stable Diffusion 3.5 Large: Это крупная модель с 8 миллиардами параметров, предназначенная для достижения высочайшего качества изображения и строгого соблюдения запросов. Она предназначена для профессионального использования, особенно на разрешении в 1 мегапиксель, но может обрабатывать различные стили и визуальные форматы.
- Stable Diffusion 3.5 Large Turbo: Для тех, кто хочет обменять немного качества на скорость, эта упрощенная версия большой модели – ваш выбор. Она производит изображения высокого качества всего за четыре шага, в отличие от обычного SD3.5, который требует около 30 шагов для генерации качественного изображения.
- Stable Diffusion 3.5 Medium: Скоро выйдет эт
_complex3_model мягкой оптимизации под потребительское оборудование и обеспечивает стабильную производительность на резюме от 0.25 до 2 мегапикселей без потери удобства настройки.
Модели стали гораздо более гибкими, позволяя пользователям тонко настраивать их под конкретные творческие потребности. Если вы беспокоитесь о том, справится ли ваша потребительская видеокарта с этим, Stability AI вас поддержит. Наши собственные тесты показали, что Large Turbo выдает изображения примерно за 40 секунд на скромной RTX 2060 с 6 ГБ VRAM.
Модели более гибкие, позволяя пользователям точно настраивать их для конкретных творческих нужд. И если вы беспокоитесь, может ли ваша потребительская GPU справиться с этим – Stability AI подумала об этом. Наши собственные тесты показали, что Large Turbo выдает изображения примерно за 40 секунд на скромной RTX 2060 с 6GB VRAM.
ComfyUI теперь поддерживает Stable Diffusion 3.5, позволяя локальное сопоставление с подписывающими узловыми рабочими процессами. Есть много примеров рабочих процессов, готовых к использованию, и если вам трудно с низким RAM, но вы хотите попробовать полноценный опыт SD3.5, Comfy выпустила экспериментальную модель fp8-scaled, которая снижает использование памяти.
Что дальше?
29 октября мы получим в свое распоряжение Stable Diffusion 3.5 Medium, и вскоре после этого Stability обещает выпустить Control Nets для SD 3.5.
Control Nets обещают принести передовые функции управления, нацеленные на профессиональные случаи использования, и они могут действительно повысить мощность SD3.5 на новый уровень. Если вы хотите узнать больше о них, вы можете прочитать краткий обзор нашего путеводителя по SD 1.5. Однако использование controlents позволит пользователям делать такие вещи, как выбор позы их субъекта, игра с картами глубины, переосмысление сцены на основе зарисовки и многое другое.