Stable Diffusion
Open-source генерация изображений — локально или через API
Stable Diffusion — это open-source модель генерации изображений из текста. Главное отличие от Midjourney и DALL·E — можно запустить бесплатно на своём компьютере (нужна видеокарта от 6 ГБ VRAM). Есть платный облачный доступ через API Stability AI — но конкретных тарифов на сайте нет, только enterprise-формат. Локальный вариант работает без VPN, без карт, без подписок — скачал модель с Hugging Face, установил WebUI и генеришь сколько хочешь. Для коммерческих проектов можно докупить лицензию или использовать API. Подходит тем, кто хочет полный контроль над моделью, возможность дообучать под свой стиль и не зависеть от подписок.
01Видеообзор
Смотрите Stable Diffusion в действии — короткий обзор интерфейса и ключевых возможностей.
02Как выглядит интерфейс
Что увидите при первом заходе — лендинг, главный экран, тарифы.

Плюсы
- Полностью бесплатный локальный запуск — скачал модель, установил WebUI и генеришь без лимитов
- Работает без VPN и без карт — всё на твоём железе
- Можно дообучать под свой стиль с помощью LoRA и DreamBooth — нужно 10–50 изображений
- Поддержка inpainting, outpainting, image-to-image — редактируешь части картинки или расширяешь за края
- Огромное комьюнити на Hugging Face и CivitAI — тысячи готовых чекпоинтов и стилей
- Открытая лицензия — можно использовать коммерчески, если соблюдаешь условия
- Запускается на обычных видеокартах от 6 ГБ VRAM — не нужен дата-центр
Минусы
- Нужна видеокарта от 6 ГБ VRAM — на встроенной графике не запустишь
- Установка WebUI требует базовых навыков работы с Python и Git — не одна кнопка
- Качество сильно зависит от промпта — короткие запросы дают хуже результат, чем у Midjourney
- Нет официального GUI от Stability AI — пользуешься сторонними интерфейсами вроде AUTOMATIC1111
- Платный API от Stability AI не имеет публичного прайса — только enterprise-формат по запросу
- Генерация медленнее облачных сервисов — 10–30 секунд на картинку в зависимости от железа
- Русский язык в промптах работает хуже английского — модель обучена в основном на англоязычных данных
03Тарифы и цены в рублях
Курс пересчитан по текущему курсу ЦБ РФ. Через агрегаторы можно получить доступ дешевле.
Локальный запуск
- Неограниченная генерация изображений
- Полный контроль над моделью и параметрами
- Inpainting, outpainting, image-to-image
- Дообучение через LoRA и DreamBooth
- Тысячи бесплатных чекпоинтов с CivitAI
- Работает без интернета после установки
- Без VPN, без карт, без подписок
Stability AI Platform API
- API для интеграции в приложения
- Нет требований к железу — всё в облаке
- Доступ к новейшим моделям Stability AI
- Enterprise-поддержка и SLA
- Тарифы и лимиты — по запросу через support
04Как зарегистрироваться и оплатить из России
Прямая регистрация с российского IP может быть заблокирована, а оплата картами РФ не везде проходит. Вот рабочий путь по шагам.
Выбери сценарий использования
Локальный запуск — если у тебя видеокарта от 6 ГБ VRAM (GTX 1060, RTX 3060 или лучше) и ты хочешь генерировать бесплатно без лимитов. Скачиваешь модель с Hugging Face или CivitAI, устанавливаешь AUTOMATIC1111 WebUI и запускаешь у себя.
Облачный API — если нужен доступ без установки или для интеграции в приложение. Регистрируешься на Stability AI Platform, получаешь API-ключ и платишь за использование. Конкретных тарифов на сайте нет — цены по запросу для enterprise.
Для первого раза проще начать с локального WebUI — установка занимает 15–30 минут, зато потом генеришь сколько хочешь бесплатно.
Установи AUTOMATIC1111 WebUI (для локального запуска)
- Скачай Python 3.10.6 и Git.
- Открой терминал и выполни:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui - Запусти
webui-user.bat(Windows) илиwebui.sh(Linux/Mac). - WebUI автоматически скачает зависимости и модель Stable Diffusion 1.5 (~4 ГБ).
- Открой браузер на
http://127.0.0.1:7860— интерфейс готов.
Если видеокарта слабая — в webui-user.bat добавь флаг --medvram или --lowvram для экономии памяти.
Скачай дополнительные модели (опционально)
Базовая модель SD 1.5 даёт средний результат. Для лучшего качества скачай чекпоинты с CivitAI или Hugging Face:
- Realistic Vision — для фотореалистичных портретов
- DreamShaper — универсальный стиль
- Anything V5 — аниме и иллюстрации
Скачанный файл .safetensors или .ckpt положи в папку models/Stable-diffusion/ внутри WebUI. Перезапусти интерфейс — модель появится в выпадающем списке.
Чекпоинты весят 2–7 ГБ каждый. Начни с одной модели, потом добавишь другие по мере необходимости.
Напиши промпт и сгенерируй первую картинку
В поле Prompt напиши описание на английском:
a cat wearing a spacesuit, floating in space, stars in background, realistic, 4k, highly detailed
В Negative prompt укажи что НЕ хочешь видеть:
blurry, low quality, distorted, ugly
Выбери размер (512×512 для начала), нажми Generate. Генерация займёт 10–30 секунд в зависимости от железа.
Чем детальнее промпт — тем лучше результат. Добавляй стилевые теги вроде cinematic lighting, oil painting, 8k resolution.
Используй inpainting для редактирования
Если хочешь изменить часть готовой картинки:
- Перейди на вкладку img2img → Inpaint.
- Загрузи изображение.
- Закрась область, которую нужно изменить (белой кистью).
- Напиши промпт с описанием новой детали.
- Нажми Generate — модель перерисует только закрашенную область.
Так можно менять фон, добавлять объекты или убирать лишнее.
Для точного редактирования ставь Denoising strength 0.5–0.7. Меньше — слабые изменения, больше — модель игнорирует оригинал.
Подключи API (для облачного доступа)
Если нужен доступ без локального запуска:
- Зарегистрируйся на platform.stability.ai.
- Получи API-ключ в разделе Account.
- Используй API для генерации:
import requests response = requests.post( "https://api.stability.ai/v1/generation/stable-diffusion-xl-1024-v1-0/text-to-image", headers={"Authorization": f"Bearer YOUR_API_KEY"}, json={"text_prompts": [{"text": "a cat in space"}]} )
Тарифы не публичные — цены уточняй через support.
API удобен для интеграции в приложения, но для экспериментов дешевле использовать локальный WebUI.
05Stable Diffusion vs конкуренты
Сравнение по ключевым параметрам. Наша колонка подсвечена.
| Параметр | |||
|---|---|---|---|
| Цена | Бесплатно локально | $10–60/мес | $20/мес (ChatGPT Plus) |
| Нужен VPN | Нет (локально) | Да | Да |
| Требования к железу | Видеокарта от 6 ГБ | Не нужно | Не нужно |
| Дообучение под свой стиль | Да (LoRA, DreamBooth) | Нет | Нет |
| Скорость генерации | 10–30 сек (зависит от GPU) | 30–60 сек | 10–20 сек |
| Качество на коротких промптах | Среднее | Отличное | Хорошее |
Теги и возможности
06Частые вопросы
Можно ли использовать Stable Diffusion бесплатно?
Да. Stable Diffusion — open-source модель, её можно скачать с Hugging Face и запустить локально без оплаты. Нужна видеокарта от 6 ГБ VRAM. Облачный доступ через API Stability AI — платный, но конкретных тарифов на сайте нет.
Нужен ли VPN для работы с Stable Diffusion?
Нет, если запускаешь локально. Модель и WebUI скачиваются с GitHub и Hugging Face — эти сайты доступны из России без VPN. Для облачного API Stability AI возможны гео-ограничения, но официальных данных нет — проверяй при регистрации.
Какая видеокарта нужна для Stable Diffusion?
Минимум 6 ГБ VRAM (GTX 1060, RTX 3050). Для комфортной работы — 8–12 ГБ (RTX 3060, RTX 4060). На 4 ГБ можно запустить с флагами --medvram или --lowvram, но генерация будет медленнее. На CPU без GPU работает очень медленно — 5–10 минут на картинку.
Чем Stable Diffusion отличается от Midjourney?
Stable Diffusion — open-source, запускается локально, бесплатно, но требует настройки и хорошего промпта. Midjourney — облачный сервис с подпиской ($10–60/мес), проще в использовании, лучше понимает короткие запросы. Stable Diffusion даёт больше контроля (можно дообучать модель, менять параметры), Midjourney — быстрее и удобнее для новичков.
Можно ли дообучить Stable Diffusion под свой стиль?
Да. Используй LoRA (Low-Rank Adaptation) или DreamBooth — нужно 10–50 изображений в едином стиле. Дообучение занимает 1–3 часа на RTX 3060. Готовые LoRA-модели можно скачать с CivitAI — там тысячи стилей от комьюнити.
Работает ли Stable Diffusion на русском языке?
Работает, но хуже чем на английском. Модель обучена в основном на англоязычных данных. Для лучших результатов пиши промпты на английском или переводи через DeepL перед генерацией.
Можно ли использовать Stable Diffusion коммерчески?
Да, если соблюдаешь условия лицензии. Базовая модель Stable Diffusion распространяется под CreativeML Open RAIL-M — можно использовать коммерчески, но нельзя генерировать запрещённый контент (насилие, порно с участием несовершеннолетних и т.д.). Для enterprise-проектов Stability AI предлагает отдельные лицензии — уточняй на stability.ai.
Что такое AUTOMATIC1111 WebUI?
Это самый популярный графический интерфейс для Stable Diffusion. Бесплатный, open-source, с кучей настроек: inpainting, outpainting, ControlNet, LoRA, скрипты для batch-генерации. Устанавливается за 15–30 минут, работает в браузере. Альтернативы — ComfyUI (для продвинутых) и Invoke AI (проще, но меньше функций).