FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion.
@GenerationMasterBot
Новый бот для генерации text2img.
— Все модели семейства FLUX, включая новую модель Flux 1.1 Pro.
— Популярные Lora в том числе 18+.
— Оригинальный MidJourney.
— Возможность попробовать бесплатно, в порядке очереди.
— Улучшение запроса с помощью ChatGPT.
— Пополняй и пробуй любую модель.
@GenerationMasterBot
Скриншоты для поста ниже.
1-2) Девушки приветствуют новый Forge! 🧍♀️🪧
3) Гоняем FLUX с ХайресФиксом в Forge (я не знаю зачем Хайрес, просто тестил функционал🤷♂️)
4) Новые удобные пресеты вверху UI. Переключаются не только плашки вверху, но и семплеры + основные настройки.
5) Кнопки интерфейса в различных полотнах Gradio4.
6) Встроенный Контролнет - используем Tile не по назначению!
Тут опять вышла новая штука, мимо которой ну никак не пройти.
УНИВЕРСАЛЬНЫЙ SD XL controlnet, который (с одной моделью) работает сразу с десятком препроцессоров:
Openpose, Depth, Canny, Lineart, AnimeLineart, Mlsd, Scribble, Hed, Pidi(Softedge), Teed, Segment (!), Normal. Так же, по моим тестам, работают ReColor и Tile/Blur (!)
Т.е., по сути, одна модель перекрывает 90% потребностей - остаются отдельные только на IP-адаптеры, инпаинт и Tile (если не устроит результат универсала).
Смелые заявления, конечно, давайте посмотрим подробнее так ли это.
Во-первых, почитаем страничку автора:
Модель имеет следующие ключевые преимущества:
- Генерация изображений высокого разрешения с гибким соотношением сторон.
- Обучение на большом количестве высококачественных данных (более 10 млн изображений).
- Высокая точность понимания подсказок благодаря перефразированным подсказкам и детальным описаниям.
- Использование передовых методов улучшения результатов в процессе обучения.
- Сопоставимое с ControlNet количество параметров без заметного увеличения вычислительных ресурсов.
- Поддерживает более 10 условий управления, при этом не наблюдается заметного снижения качества работы с отдельными условиями по сравнению с моделями, обученными для работы с одним условием.
- Поддерживает генерацию изображений с несколькими условиями, при этом слияние условий происходит в процессе обучения, без необходимости ручной настройки гиперпараметров или подсказок.
Картинки к сообщению ниже.
1-4) Результаты рисовки по простым промтам.
5-7) Сложносоставной промт на ~120 токенов. Предварительная отработка на 6 и 7 не менялась, картинка рендрилась в разных разрешениях.
8) Потребление памяти при локальном запуске.
9) Интерфейс.
Конкурс Дамы и Господа.
@deeppaintbot совместно с
@digitalrazor_pc проводит конкурс на лучшую ИИ генерацию.
Главный приз — сотрудничество на постоянной основе с DigitalRazor.
Правила, тематика и призы:
t.me/text2image/314014/314047
⚡️Молниеносная генерация изображений.
SDXL-Lightning — модель для генерации картинок по текстовому запросу с разрешением 1024х1024.
— Вводим промпт;
— Выбираем количество шагов от 1 до 8 (чем больше, тем лучше будет качество результата);
— Менее чем за минуту получаем бесплатную готовую пикчу.
• Код на huggingface
• Попробовать
• Colab (Free)
#иинструмент
🔥 OpenAI пишут историю на наших глазах.
Встречаем Sora — новая модель text2video от OpenAI.
Нейросеть создает слишком реалистичные ролики продолжительностью до минуты и может генерировать сложные сцены с несколькими персонажами и точными деталями даже на фоне. И всё это по довольно простому промпту.
Модель пока тестируют, но обещают дать попробовать и обычным смертным. Ждёмс😃
• Подробнее 1
• Подробнее 2
🔥 InstantID : Zero-shot Identity-Preserving Generation in Seconds.
InstantID - новая модель, которая может генерировать индивидуальные изображения с различными позами или стилями на основе одного эталонного изображения без какого-либо обучения!
1 фото > 60 сек > Готово 🪄
• GitHub
• Попробовать
#иинструмент
🔥 Фаер-шоу от нейросетей.
Создано с помощью Stable Diffusion + AnimateDiffV3.
• Рабочий процесс
• Подробнее
😎 Создаем новую аватарку.
PhotoMaker — генератор изображений от TencentArc, который превратит вас в кого угодно: Железного человека, рыцаря, повелителя драконов или на что хватит фантазии😃
— Загрузите фото (можно несколько), где большую часть изображения занимает лицо;
— Введите текстовую подсказку;
— Выберите предпочитаемый стиль.
Пробуем бесплатно:
• Реалистичная генерация
• Стилизованная
• GitHub
• Colab Pro
#иинструмент
🖐🏻 Исправляем кривые руки на изображениях.
Для борьбы со злом создали HandRefiner, которая исправляет артефакты с руками в пару кликов.
Теперь нейрогенерации ещё сложнее отличить от реальных фото.
• Github
• Colab
Обновление и улучшение отличного базового чекпоинта SD XL PixelWave - отдельная ветка Turbo!
Что бы не путать пользователей, автор вынес турбированные версии в отдельную ссылку. Версия 02 сделана на основе PixelWave 06 и показывает нам отличные результаты + улучшенная работа с руками и лицами и всё это за 5 шагов в 1024х1024 базовом разрешении! По-моему, отличная база как для обычных генераций, так и для различных ботов/генераторов.
Ссылка тут — https://civitai.com/models/215538/pixelwaveturbo-excellent-images-in-5-steps
Обсудить / пообщаться
Наш чат @text2image
Лора на костюм Лолы Банни, из одного старого мультика. Если вы её знаете - то жму вам лапу, товарищи динозавры 🦖🦕
Ссылка (SD 1.5) — https://civitai.com/models/242281/lola-costume
Обсудить / пообщаться
Наш чат @text2image
Свежие слайдеры ✨
1) Колючки! Сделайте "ежа" из всего, чего хотите 😼 SD XL.
2) Размер радужки глаз. Да, и так тоже можно! SD 1.5.
3) Слайдер "веса" 😱 SD 1.5.
Обсудить / пообщаться
Наш чат @text2image
Новогодние подарки от авторов посыпались😼
Обновление отличного чекпоинта общей направленности (+фотореализм) Juggernaut, только в версии для SD 1.5. Пять месяцев автор не обновлял его, и вот, под НГ приготовил хороший сюрприз!
Ссылка — https://civitai.com/models/46422
Обсудить / пообщаться
Наш чат @text2image
И снова мега крутая штука. И снова от lllyasviel (автор Контролнета, Фооокуса, Омоста). Точнее даже не новая штука, а легендарный камбэк :)
Итак, автор обновил свой "Автоматик" - Forge до версии 2.0.0. Ну, обновил это слабо сказано. Если посмотреть коммиты - там переписано всё (иногда по 2-3 раза): бэкэнд, фронтэнд, модули, оптимизации, очень старые фишки которые давно надо было переделать. Технических обновлений очень много, их просто не перечислить (общее количество правок более 2 миллионов строк!). Давайте посмотрим, что можно получить нам, как пользователям:
— Одно из главных нововведений - это обновление Gradio до 4.х+. Он стал стабильнее, отзывчивее, туда добавлена гора новых фишек, при этом сохранился понятный интерфейс. Удобные пространства и рисование во вкладках инпаинта, новые кнопки в работе с изображениями, функциональные слайдеры и т.п.
— Поддержка всего на свете. SD3? FLUX? HunyuanDiT? Kolors? Playground? Сигмы и всё такое? Это тут теперь есть! Так же расширена поддержка Диффузеров, поэтому можно будет довольно легко добавить любую свежую модель.
— Про FLUX ещё отдельно скажу. lllyasviel сделал собственную имплементацию инфернеса этого чекпоинта и реализовал "прямую" работу с bnb NF4. Для тех кто не понял - это "настоящая" работа чекпоинта в int4, по качеству и скорости превосходящее текущие реализации FP8. Для тех кто всё ещё не понял - подробности тут :) По тестам - FLUX входит в 8 Гб VRAM, но может работать и с 6 (4?). Запустить это можно на 30ХХ+ карточках (ниже просто не поддерживают int4 тензоры на "железном" уровне) и с Cuda-библиотекой версии выше 12.4. Если у вас видеокарта старее - используйте fp8 реализацию.
— Реализовано полноценное управление Shared-памятью. Если у вас не хватает видеопамяти на очередную современную модель - часть можно скинуть в RAM. Раньше это делалось автоматически, на основе драйверов. Теперь - можно чётко указать сколько оставить в VRAM (в мегабайтах) и кто будет управлять выгруженной памятью (процессор или видеокарта)
— Оптимизации контролнета и поддержка новых фитч. Переписана логика работы КН, он теперь куда более плотно встроен в бэкэнд, что увеличивает как скорость загрузки, так и скорость работы. А так же добавлены модели, которые мы уже видели в контролнете Автоматика1111. В ближайшее время автор добавит пачку новых фитч, которые были реализованы как проект, но в "больших" интерфейсах особо не появлялись.
Как это всё установить и пользоваться? По сути, тут ничего не поменялось - ставите Python, git, и дальше любым удобным способом по старой ссылке. Или можно скачать упакованный релиз отсюда - https://github.com/lllyasviel/stable-diffusion-webui-forge/releases. Там можно выбрать готовый вариант webui_forge_cu124_torch24.7z для Куды 12.4 (30хх+ карты) или с Кудой 12.1 для остальных. После распаковки достаточно запустить run.bat и остальные установки сделаются сами (Питон и Гит всё равно уже должны быть у вас установлены). От себя порекомендую поставить Forge с нуля, а не обновлять старую версию (что бы не получить ошибок).
По моим тестам - весь базовый функционал работает. Т2и, И2и, апскелинг, лоры, контролнеты (успел проверить не все). Понятно, что большинство расширений отвалилось. Но, во-первых, в Forge уже встроено 80% того, что нужно (контролнет, различные фиксы и оптимизаторы, мультидиффузия), а, во-вторых, авторы крупных расширений (аДеталер, АниматеДифф) уже взялись за подгонку своих проектов.
По скорости в обычных задачах (генерации+лоры/контролнет) прирост у Форджа относительно последней версии Автоматика ~30-40%. И2и (как и раньше) прирост вообще сумасшедший, от 50% ускорения и выше.
Небольшое обновление в ControlNet Automatic1111, касательно предыдущего поста. Если обновиться и переименовать модель в controlnet++_union_sdxl
(или часть имени сделать таким), то данный контролнет будет видится во всех официально поддерживаемых режимах. Чуть-чуть подробностей по ссылке - https://github.com/Mikubill/sd-webui-controlnet/discussions/2989
Кстати, лайфхак (кто ещё сам не догадался 👀)! Если использовать одну модель на несколько юнитов - выйдет значительная экономия памяти (только одна модель будет в VRAM). Максимально актуально это для работы с AnimatedDiff, где теперь можно спокойно юзать 4-5 контролнетов.
Всем привет!
Давно не писал в группу (слишком много дел и мало свободного времени), но тут просто нельзя пройти мимо.
Итак, всем известный разработчик lllyasviel (автор контролнета, Фооокуса, Форджа, свежего Релайта) выпустил новую шикарную вещь.
Omost - https://github.com/lllyasviel/Omost
Это LLM (большая языковая модель), которая по вашему запросу создаёт крутейшую картину с максимальным вниманием к деталям. Что бы было понятнее, принцип как у Dalle-3: вы даёте короткий промт (или максимально развёрнутый, по желанию), а ЛЛМ очень подробно расписывает ваш запрос, раскладывает его на составные части, планирует как всё это будет выглядеть в общем и в частностях.
Если интересно в подробностях, загляните на страницу, Иллия расписал всё сверхпонятно: как описывается начало, как разбивается на регионы, каким образом редактировать растояние до "зрителя", развёртка каждой части промта. После подготовительного этапа вся эта информация отправляется на генерацию. По умолчанию используется чекпоинт XL RealVisXL_V4.0 но можно подкинуть ему любой (в формате Диффузерсов). "Подготовительные" ЛЛМ, кстати, тоже стандартные (ллама-3, phi-3 и дельфин 2.9), единственное что - им требуется специальная дотренировка.
Выше я приложил картинки, которые получаются у Omost. Первые сделаны по простым промтам (битва тысяч орков и людей у города, орк бежит возле рушающейся стены, эльфийки плывут, идут вброд по реке), а следующая - подробно описана (цвет штанов, куртки, футболки, надпись на ней, ночной город с многоэтажками, стилистика аниме/не аниме). Конечно, проблемы нейросетей никуда не делись, но следование промту и внимание к деталям очень хороши.
Как же всё это потрогать, спросите вы?
Во-первых, есть готовая демка на Обнимашках. Работает она быстро (к тому же, абсолютно бесплатно и без ограничений), но порой не хочет рендрить картинку. Тут претензия к самим обнимашкам, да. Где-то 5 из 10 запросов у меня отработало нормально.
И конечно же, Иллия не был бы собой, если бы всё это не было доступно локально! Ссылка на инструкцию по локальной установке. Пройдёмся по пунктам.
Во-первых, естествинно, вам нужен Питон. Автор рекомендует 3.10.хх, соответственно, скачиваете 3.10.6 или 3.10.11 (что бы точно всё заработало). Если вы скачаете последнюю версию - ничего не заработает!
Далее нужны установленные git и Анаконда для 3.10.
Поставив всё в такой очерёдности (не забывайте обязательно ставить галки "добавить в ПУТЬ" и "интеграция с питоном" где они есть), открываем Anaconda Prompt (miniconda3) появившуюся у вас в Пуске и поочерёдно выполняем строчки инструкции на странице выше. Когда всё скачается и установится (5-20 минут) откроется ваш браузер по адресу http://localhost:7860 где будет простенький интерфейс для работы.
Что по памяти? Тут всё отлично, "базовая" ллама-3 q4 спокойно входит в 8 гигабайт VRAM (Скриншоты выше - во время работы ЛЛМ), ну а картинки рисуются на XL, что так же спокойно помещается там же.
На моей 3060 предварительный этап (развёртка через ЛЛМ) занимает где-то полторы-две минуты, рисовка картинки 1536х896 - секунд 40 без Хайрес-фикса и 3-4 минуты с ним.
Интерфейс, пока, максимально простой - нет ни смены чекпоинта, ни семплеров, ни сохранения картинок, ни даже батника запуска. Очень надеюсь на сообщество, что это нам быстро прикрутят :) Но если вы хотите пощупать одним из первых - то уже можно.
🌟 Боты от DeepFaker 🎚️
• DeepPaint Telegram Bot
Бот для работы с фотографией.
- Замена лица на фото.
- Улучшение лица.
- Улучшение фулл фото.
- Удаление фона на фото.
Работает бесплатно, в порядке общей очереди.
• MidJourney Telegram Bot
Бот использует алгоритмы MidJourney, а не аналоги, поэтому полностью платный.
- Простая оплата из РФ.
- Доступны все режимы генераций.
- Адекватные цены.
- Быстрая генерация.
- Доступна 6 версия MidJourney.
• SlookBot
Твой персональный ИИстилист.
- Загружаем фото.
- Пишем запрос.
- Оцениваем себя в новом образе.
😃 Все наши ресурсы и боты:
@qrcode
🥳 Stable Diffusion 3.0
Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image.
Улучшено качество изображений, улучшено написание текста
(?! смотрим прикреплённую пикчу), более высокая производительность и тд.
На данный момент доступ через лист ожидания.
• Подробнее
💻 Генератор изображений с удобным интерфейсом.
Энтузиаст запилил приятный интерфейс для нейронки GLIGEN: тут есть поля для рисования, подсказок и настройки — всё просто и доступно.
Нейросеть известна тем, что может генерировать объекты по текстовой подсказке в заданных вами областях и поддерживает различные стили.
• Github
• Подробнее
• Попробовать на HuggingFace
#иинструмент
🧑🎨 Новинка от Stability AI.
Вышла новая модель Stable Cascade для генерации изображений по текстовой подсказке. Процесс занимает пару секунд, а на выходе получается детализированная пикча, не уступающая по качеству SD XL. Плюс нейросеть может генерить даже текст.
Бесплатно, промпты понимает только на английском языке.
• Попробовать
• Colab (Free)
• Подробнее
#иинструмент
👩🏼 Создаем свою ИИ-фотомодель.
Всё чаще в новостях мелькают нейромодели, которые зарабатывают сотни тысяч долларов. Оказывается, создать свою — дело пары минут.
— Регистрируемся на сайте RenderNet;
— Нажимаем кнопку "Goto Studio", выбираем "Epic Realism" и придумываем текстовую подсказку с описанием внешности девушки;
— Получаем изображение и кликаем "Facelock", чтобы сохранить референс лица для следующих генераций в разной одежде/ракурсах/локациях.
Бесплатно можно сделать 50 генераций.
• Попробовать
#иинструмент
📹 Контроль движения камеры на видео.
Tencent выпустили MotionCtrl — унифицированный и гибкий контроллер для эффективного управления движениями камеры и объектов в сгенерированных видеороликах.
MotionCtrl можно развернуть на LVDM, VideoCrafter1, AnimateDiff и SVD.
• Подробнее
• Попробовать
#иинструмент
🎞 ИИ-трейлер для реального сериала.
Команда из 3 человек работала около недели над созданием реалистичного трейлера с помощью Stable Video Diffusion.
Посвящается всем, кто любит подумать о Римской империи ☕️
Немного свежих концептов.
1) Фейерверк-арты! Нарисует ваш промт в виде праздничного фейерверка 🎄🎇🎆 SD XL.
2) Луковичный стиль. Для луколюбов! SD XL.
3) Интерьер автобуса. Реалистик и Аниме. SD 1.5.
4) Генератор изометрических сцен из игр. SD 1.5.
5) Генератор концептов домов в европейском и американском стиле. SD 1.5.
Обсудить / пообщаться
Наш чат @text2image
Лоры-концепты.
1) Оружие в стиле Fallout 3+. SD XL.
2) Летающие корабли и острова. SD 1.5.
3) Футуристичные небоскрёбы и застройка. SD 1.5.
4) Момент вручения вам подарка ❤️ SD 1.5.
5) Качественная стилистика художника WLOP для SD XL.
Обсудить / пообщаться
Наш чат @text2image
Непостоянная рубрика "для геймдева"
Генератор кнопочек, бейджиков, табличек и т.п.
Хватает простого промта, Лора следует указанному в тексте цвету и особенностям.
Ссылка (SD 1.5) — https://civitai.com/models/243262/mwbutton
Обсудить / пообщаться
Наш чат @text2image
Ещё один предновогодний подарок от авторов - релиз AniVerse v1.6. Это одна из лучших (может и лучшая) анимешных моделей (SD 1.5) для тренировок Лор и работы с Лорами.
Ссылка — https://civitai.com/models/107842
Обсудить / пообщаться
Наш чат @text2image
Немного "плёночных" стилистик.
1) Полароид-снимки. SD 1.5.
2) Шикарнейшая Лора имитирующая "стиль" Kodak Motion Picture Film. Модель построит крутую кинематографичную сцену, добавит ярких деталей и "прилижет" композицию. SD XL.
3) Имитация цветного CRT TV. SD 1.5.
Обсудить / пообщаться
Наш чат @text2image