AI-чатбот для генерации изображений¶

В этой статье

AI-чатбот для генерации изображений. Основные возможности

Особенности сборки

Начало работы после развертывания AI-чатбота

Стартовое меню AI-чатбота

Заказ сервера с AI-чатботом с помощью API

Информация

AI-чатбот для генерации изображений — это интерактивный инструмент, работающий на базе Stable Diffusion Web UI. Он позволяет создавать визуальный контент с помощью текстовых запросов в формате диалога.

AI-чатбот для генерации изображений. Основные возможности¶

Генерация изображений из текста (txt2img) — преобразует текстовые запросы пользователей в высококачественные изображения с настраиваемыми параметрами и стилями;
Модификация существующих изображений (img2img) — позволяет изменять загруженные пользователем изображения на основе текстовых инструкций с контролем степени изменений;
Инпаинтинг и аутпаинтинг — интерактивные инструменты для замены или дорисовки отдельных частей изображения;
Различные методы сэмплирования — доступны через интерфейс базовой системы Stable Diffusion Web UI множество алгоритмов (DPM++, Euler, LMS и др.) для контроля качества и скорости генерации;
Управление семплами и чекпоинтами — возможность сохранения и загрузки различных моделей и весов для настройки стиля генерации;
Интеграция с дополнительными инструментами — совместимость с GFPGAN, CodeFormer и другими инструментами для улучшения качества изображений;
Диалоговый интерфейс — естественное общение с AI для уточнения параметров и итеративного улучшения результатов;
Масштабирование и улучшение разрешения — встроенные инструменты для повышения качества изображений;
Расширяемость через скрипты и плагины — поддержка пользовательских расширений для дополнительных функций;
Встроенные подсказки и руководства — интерактивная помощь с рекомендациями по созданию эффективных запросов.

Особенности сборки¶

ID	Совместимые ОС	VPS	BM	VGPU	GPU	Мин. ЦПУ (Ядер)	Мин. ОЗУ (Гб)	Мин. HDD/SDD (Гб)	Доступно
186	Ubuntu 22.04 GPU	+	+	+	+	4	32	-	Нет

Время на установку 10-15 минут вместе с OS.
Системные требования:
- Процессор: минимум 4 ядра CPU;
- Оперативная память: минимум 32 ГБ RAM;
- Видеокарта: рекомендуется не менее 8 ГБ видеопамяти (VRAM).
Поддерживаемые разрешения изображений:
- Базовое разрешение для стандартных моделей: 512 × 512;
- Возможность генерации изображений с другими соотношениями сторон и разрешениями.
Предустановленные зависимости:
- Python 3.10.12
- python3-venv (инструмент для создания изолированных Python-окружений)
- python-dev (заголовочные файлы и библиотеки для разработки)
- python3-pip (менеджер пакетов Python)
- NVIDIA драйверы
Рабочий каталог проекта: /home/sd/stable-diffusion-webui.
Предустановленные модели: sd3_medium_incl_clips_t5xxlfp8.safetensors

Начало работы после развертывания AI-чатбота¶

После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.

Данные для авторизации, которые можно найти или во вкладке Информация >> Тэги панели управления сервером или в присланном e-mail:

Ссылка для доступа к панели управления AI-чатбота с веб-интерфейсом: в теге webpanel;
Логин и Пароль: приходит в письме на вашу электронную почту при готовности сервера к работе после развертывания ПО.

Стартовое меню AI-чатбота¶

После перехода по ссылке из тега webpanel будет открыт веб-интерфейс AI-чатбота на базе Stable Diffusion Web UI:

Для генерации изображений через чатбот необходимо выполнить следующий алгоритм действий:

Начните диалог с чатботом, описывая желаемое изображение. Чатбот может предложить два режима генерации:
- txt2img: генерация изображения из текстового описания;
- img2img: модификация загруженного изображения на основе текста.
Опишите желаемое изображение максимально детально. Чатбот поможет сформулировать эффективный запрос (prompt):

Опционально: уточните, что не должно присутствовать на изображении (negative prompt).

Настройка параметров

Чатбот предложит настроить следующие параметры:
- Seed: выберите конкретное значение или используйте случайный сид (-1);
- Sampling method: DPM++ 2M или Euler рекомендуется для стандартных результатов;
- Sampling steps: 30 для оптимального качества;
- Image size: стандартно 1024×1024 или другие кратные размеры;
- CFG Scale: значение 7 для баланса между креативностью и точностью.
Дополнительные опции по запросу:
- Hires. fix: для повышения детализации;
- Refiner: для дополнительной обработки результата.
Отправьте окончательный запрос и дождитесь генерации — чатбот отобразит результат.

Дополнительные функции в интерфейсе Stable Diffusion Web UI

PNG Info: просмотр и извлечение параметров из созданных изображений;
Extras: дополнительные инструменты обработки изображений;
Checkpoint Merger: объединение моделей для создания гибридных стилей;
Train: инструменты для обучения собственных моделей.

Примечание

Подробная информация по основным настройкам Stable Diffusion Web UI содержится в документации разработчиков.

Заказ сервера с AI-чатботом с помощью API¶

Для установки данного ПО с использованием API следуйте этой инструкции.