Задача 05B. Stable diffusion. Textual Inversion
Условие
Требуется выполнить дообучение модели stable diffusion с использованием метода Textual Inversion.
Требования к датасету
- Датасет должен содержать изображения, объединённые некоторой тематикой или стилем, который тяжело воспроизводится с использованием stable diffusion.
- Запрещено использовать датасет cat-toy-example.
- Датасет можно найти, например, здесь.
Требования к модели
- Предпочтительно использовать sdxl или sdxl-turbo.
- Если не получается с sdxl, разрешено использовать предыдущие версии модели (2, 1.5)
Требования к реализации
Распределение баллов
Максимальное количество баллов за задачу — 10.
- Обучение, до + 4.
- Тестирование, до + 4.
- Сгенерировать некоторое множество изображений с использованием обученных embedding (в том числе во время сдачи).
- Продемонстрировать, что изображения с использованием embeddings генерируются согласно тематики лучше, чем без.
- Обучить ещё один embedding, продемонстрировать взаимодействие с предыдущими, до + 2.
Отправка решения
В качестве решения требуется отправить ссылку на файл (PDF, MS Word, plain text) или репозиторий, содержащий информацию об использованном датасете, trigger words, а также ссылку на обученные веса для использованием со stable-diffusion-webui.