Telegram-канал text2img - Stable Diffusion | Text2img: Unsorted - каталог телеграмм

text2img | Unsorted

Subscribe to a channel

Telegram-канал text2img - Stable Diffusion | Text2img

12175

Про нейросети @deepfaker Наш чат @text2image MidJourney Telegram Bot @MidJourneyFree_Bot Связь @cocuc

Subscribe to a channel

Stable Diffusion | Text2img

05 Oct 2024 12:34

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion.

@GenerationMasterBot

Новый бот для генерации text2img.
— Все модели семейства FLUX, включая новую модель Flux 1.1 Pro.
— Популярные Lora в том числе 18+.
— Оригинальный MidJourney.
— Возможность попробовать бесплатно, в порядке очереди.
— Улучшение запроса с помощью ChatGPT.
— Пополняй и пробуй любую модель.

@GenerationMasterBot

Читать полностью…

Stable Diffusion | Text2img

11 Aug 2024 17:17

Скриншоты для поста ниже.
1-2) Девушки приветствуют новый Forge! 🧍‍♀️🪧
3) Гоняем FLUX с ХайресФиксом в Forge (я не знаю зачем Хайрес, просто тестил функционал🤷‍♂️)
4) Новые удобные пресеты вверху UI. Переключаются не только плашки вверху, но и семплеры + основные настройки.
5) Кнопки интерфейса в различных полотнах Gradio4.
6) Встроенный Контролнет - используем Tile не по назначению!

Читать полностью…

Stable Diffusion | Text2img

07 Jul 2024 21:03

Тут опять вышла новая штука, мимо которой ну никак не пройти.
УНИВЕРСАЛЬНЫЙ SD XL controlnet, который (с одной моделью) работает сразу с десятком препроцессоров:
Openpose, Depth, Canny, Lineart, AnimeLineart, Mlsd, Scribble, Hed, Pidi(Softedge), Teed, Segment (!), Normal. Так же, по моим тестам, работают ReColor и Tile/Blur (!)
Т.е., по сути, одна модель перекрывает 90% потребностей - остаются отдельные только на IP-адаптеры, инпаинт и Tile (если не устроит результат универсала).
Смелые заявления, конечно, давайте посмотрим подробнее так ли это.
Во-первых, почитаем страничку автора:

Модель имеет следующие ключевые преимущества:
- Генерация изображений высокого разрешения с гибким соотношением сторон.
- Обучение на большом количестве высококачественных данных (более 10 млн изображений).
- Высокая точность понимания подсказок благодаря перефразированным подсказкам и детальным описаниям.
- Использование передовых методов улучшения результатов в процессе обучения.
- Сопоставимое с ControlNet количество параметров без заметного увеличения вычислительных ресурсов.
- Поддерживает более 10 условий управления, при этом не наблюдается заметного снижения качества работы с отдельными условиями по сравнению с моделями, обученными для работы с одним условием.
- Поддерживает генерацию изображений с несколькими условиями, при этом слияние условий происходит в процессе обучения, без необходимости ручной настройки гиперпараметров или подсказок.

Во-вторых, тесты и сравнения с другими моделями!
По картинкам выше. Тестируемая модель названа xinsir_controlnet_xl_UNIVERSAL. Все тесты делал на realismEngineSDXL_v30 (animaPencilXL_v5, если аниме), DPM++ 2M семплер, 20 шагов, 5 CFG, без хайрес фиксов. Промт брал автотагером, негатив - простой стандартный. "Остановка работы" и "Вес" контролнета брались в зависимости от используемого препроцессора, в среднем 0.7-0.9. Выборку не делал, всё с первых попыток.
1-2) Глубина. Здесь и далее - исходник/отработка. У глубины куча различных препроцессоров - и на всех отработало хорошо.
3-4) Тест ОпенПоз. Режим работы контролнета выставлен "ControlNet is more important" (так надо для ОпенПоз).
5-6) Различные Line-препроцессоры. Сравниваем с предыдущим чемпионом - mistoLine.
7-8) Самые проблемные - Сегментация и Normal. Адекватных моделек на сегментацию (для SD XL) до этого не было, и похоже эта - первая нормальная. С Нормалями та же история. Так же интересно, что нарисовано это на реалистик чекпоинте (хоть и с примесью аниме).
9-10) Tile. Сравниваем, опять же с предыдущим "победителем" от того же автора - xinir_Tile. Этот контролнет служит для улучшения качества картинки, но можно и чуть-чуть поднять параметры кастомизации и получить картинку "по мотивам". Первый вариант на изображении - улучшение, второй - "вольная интерпретация". Работает (в первом случае) не идеально, но это вообще автором не планировалось.

Что у нас в выводах? Автор не соврал, и действительно - одна модель может заменить большинство существующих. По качеству она так же либо не уступает другим, либо превосходит.
Модель уже работает в Автоматике1111 (Комфи тоже, естественно), обновлять ничего не нужно. Скачайте, положите в папку с ControlNet, переименуйте как удобно и пользуйтесь! Единственное, что контролнет, по-умолчанию, фильтрует модели по типу, и что бы увиделась ваша моделька - нужно нажать рядом с выбором модели кнопку "обновить" (это сбросит фильтр, в том числе).

Читать полностью…

Stable Diffusion | Text2img

01 Jun 2024 15:50

Картинки к сообщению ниже.
1-4) Результаты рисовки по простым промтам.
5-7) Сложносоставной промт на ~120 токенов. Предварительная отработка на 6 и 7 не менялась, картинка рендрилась в разных разрешениях.
8) Потребление памяти при локальном запуске.
9) Интерфейс.

Читать полностью…

Stable Diffusion | Text2img

05 Mar 2024 17:02

Конкурс Дамы и Господа.

@deeppaintbot совместно с
@digitalrazor_pc проводит конкурс на лучшую ИИ генерацию.

Главный приз — сотрудничество на постоянной основе с DigitalRazor.

Правила, тематика и призы:
t.me/text2image/314014/314047

Читать полностью…

Stable Diffusion | Text2img

22 Feb 2024 08:37

⚡️Молниеносная генерация изображений.

SDXL-Lightning — модель для генерации картинок по текстовому запросу с разрешением 1024х1024.

— Вводим промпт;
— Выбираем количество шагов от 1 до 8 (чем больше, тем лучше будет качество результата);
— Менее чем за минуту получаем бесплатную готовую пикчу.

• Код на huggingface
• Попробовать
• Colab (Free)

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

16 Feb 2024 05:53

🔥 OpenAI пишут историю на наших глазах.

Встречаем Sora — новая модель text2video от OpenAI.

Нейросеть создает ~~слишком~~ реалистичные ролики продолжительностью до минуты и может генерировать сложные сцены с несколькими персонажами и точными деталями даже на фоне. И всё это по довольно простому промпту.

Модель пока тестируют, но обещают дать попробовать и обычным смертным. Ждёмс😃

• Подробнее 1
• Подробнее 2

Читать полностью…

Stable Diffusion | Text2img

23 Jan 2024 15:33

🔥 InstantID : Zero-shot Identity-Preserving Generation in Seconds.

InstantID - новая модель, которая может генерировать индивидуальные изображения с различными позами или стилями на основе одного эталонного изображения без какого-либо обучения!

1 фото > 60 сек > Готово 🪄

• GitHub
• Попробовать

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

19 Jan 2024 08:15

🔥 Фаер-шоу от нейросетей.

Создано с помощью Stable Diffusion + AnimateDiffV3.

• Рабочий процесс
• Подробнее

Читать полностью…

Stable Diffusion | Text2img

17 Jan 2024 12:10

😎 Создаем новую аватарку.

PhotoMaker — генератор изображений от TencentArc, который превратит вас в кого угодно: Железного человека, рыцаря, повелителя драконов или на что хватит фантазии😃

— Загрузите фото (можно несколько), где большую часть изображения занимает лицо;
— Введите текстовую подсказку;
— Выберите предпочитаемый стиль.

Пробуем бесплатно:
• Реалистичная генерация
• Стилизованная
• GitHub
• Colab Pro

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

09 Jan 2024 14:14

🖐🏻 Исправляем кривые руки на изображениях.

Для борьбы со злом создали HandRefiner, которая исправляет артефакты с руками в пару кликов.

Теперь нейрогенерации ещё сложнее отличить от реальных фото.

• Github
• Colab

Читать полностью…

Stable Diffusion | Text2img

29 Dec 2023 04:33

Обновление и улучшение отличного базового чекпоинта SD XL PixelWave - отдельная ветка Turbo!

Что бы не путать пользователей, автор вынес турбированные версии в отдельную ссылку. Версия 02 сделана на основе PixelWave 06 и показывает нам отличные результаты + улучшенная работа с руками и лицами и всё это за 5 шагов в 1024х1024 базовом разрешении! По-моему, отличная база как для обычных генераций, так и для различных ботов/генераторов.

Ссылка тут — https://civitai.com/models/215538/pixelwaveturbo-excellent-images-in-5-steps

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

27 Dec 2023 05:44

Лора на костюм Лолы Банни, из одного старого мультика. Если вы её знаете - то жму вам лапу, товарищи динозавры 🦖🦕
Ссылка (SD 1.5) — https://civitai.com/models/242281/lola-costume

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

26 Dec 2023 04:21

Свежие слайдеры ✨

1) Колючки! Сделайте "ежа" из всего, чего хотите 😼 SD XL.
2) Размер радужки глаз. Да, и так тоже можно! SD 1.5.
3) Слайдер "веса" 😱 SD 1.5.

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

25 Dec 2023 16:12

Новогодние подарки от авторов посыпались😼

Обновление отличного чекпоинта общей направленности (+фотореализм) Juggernaut, только в версии для SD 1.5. Пять месяцев автор не обновлял его, и вот, под НГ приготовил хороший сюрприз!
Ссылка — https://civitai.com/models/46422

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

11 Aug 2024 17:17

И снова мега крутая штука. И снова от lllyasviel (автор Контролнета, Фооокуса, Омоста). Точнее даже не новая штука, а легендарный камбэк :)

Итак, автор обновил свой "Автоматик" - Forge до версии 2.0.0. Ну, обновил это слабо сказано. Если посмотреть коммиты - там переписано всё (иногда по 2-3 раза): бэкэнд, фронтэнд, модули, оптимизации, очень старые фишки которые давно надо было переделать. Технических обновлений очень много, их просто не перечислить (общее количество правок более 2 миллионов строк!). Давайте посмотрим, что можно получить нам, как пользователям:

— Одно из главных нововведений - это обновление Gradio до 4.х+. Он стал стабильнее, отзывчивее, туда добавлена гора новых фишек, при этом сохранился понятный интерфейс. Удобные пространства и рисование во вкладках инпаинта, новые кнопки в работе с изображениями, функциональные слайдеры и т.п.
— Поддержка всего на свете. SD3? FLUX? HunyuanDiT? Kolors? Playground? Сигмы и всё такое? Это тут теперь есть! Так же расширена поддержка Диффузеров, поэтому можно будет довольно легко добавить любую свежую модель.
— Про FLUX ещё отдельно скажу. lllyasviel сделал собственную имплементацию инфернеса этого чекпоинта и реализовал "прямую" работу с bnb NF4. Для тех кто не понял - это "настоящая" работа чекпоинта в int4, по качеству и скорости превосходящее текущие реализации FP8. Для тех кто всё ещё не понял - подробности тут :) По тестам - FLUX входит в 8 Гб VRAM, но может работать и с 6 (4?). Запустить это можно на 30ХХ+ карточках (ниже просто не поддерживают int4 тензоры на "железном" уровне) и с Cuda-библиотекой версии выше 12.4. Если у вас видеокарта старее - используйте fp8 реализацию.
— Реализовано полноценное управление Shared-памятью. Если у вас не хватает видеопамяти на очередную современную модель - часть можно скинуть в RAM. Раньше это делалось автоматически, на основе драйверов. Теперь - можно чётко указать сколько оставить в VRAM (в мегабайтах) и кто будет управлять выгруженной памятью (процессор или видеокарта)
— Оптимизации контролнета и поддержка новых фитч. Переписана логика работы КН, он теперь куда более плотно встроен в бэкэнд, что увеличивает как скорость загрузки, так и скорость работы. А так же добавлены модели, которые мы уже видели в контролнете Автоматика1111. В ближайшее время автор добавит пачку новых фитч, которые были реализованы как проект, но в "больших" интерфейсах особо не появлялись.

Как это всё установить и пользоваться? По сути, тут ничего не поменялось - ставите Python, git, и дальше любым удобным способом по старой ссылке. Или можно скачать упакованный релиз отсюда - https://github.com/lllyasviel/stable-diffusion-webui-forge/releases. Там можно выбрать готовый вариант webui_forge_cu124_torch24.7z для Куды 12.4 (30хх+ карты) или с Кудой 12.1 для остальных. После распаковки достаточно запустить run.bat и остальные установки сделаются сами (Питон и Гит всё равно уже должны быть у вас установлены). От себя порекомендую поставить Forge с нуля, а не обновлять старую версию (что бы не получить ошибок).

По моим тестам - весь базовый функционал работает. Т2и, И2и, апскелинг, лоры, контролнеты (успел проверить не все). Понятно, что большинство расширений отвалилось. Но, во-первых, в Forge уже встроено 80% того, что нужно (контролнет, различные фиксы и оптимизаторы, мультидиффузия), а, во-вторых, авторы крупных расширений (аДеталер, АниматеДифф) уже взялись за подгонку своих проектов.
По скорости в обычных задачах (генерации+лоры/контролнет) прирост у Форджа относительно последней версии Автоматика ~30-40%. И2и (как и раньше) прирост вообще сумасшедший, от 50% ускорения и выше.

Читать полностью…

Stable Diffusion | Text2img

10 Jul 2024 05:08

Небольшое обновление в ControlNet Automatic1111, касательно предыдущего поста. Если обновиться и переименовать модель в controlnet++_union_sdxl (или часть имени сделать таким), то данный контролнет будет видится во всех официально поддерживаемых режимах. Чуть-чуть подробностей по ссылке - https://github.com/Mikubill/sd-webui-controlnet/discussions/2989

Кстати, лайфхак (кто ещё сам не догадался 👀)! Если использовать одну модель на несколько юнитов - выйдет значительная экономия памяти (только одна модель будет в VRAM). Максимально актуально это для работы с AnimatedDiff, где теперь можно спокойно юзать 4-5 контролнетов.

Читать полностью…

Stable Diffusion | Text2img

01 Jun 2024 15:50

Всем привет!
Давно не писал в группу (слишком много дел и мало свободного времени), но тут просто нельзя пройти мимо.

Итак, всем известный разработчик lllyasviel (автор контролнета, Фооокуса, Форджа, свежего Релайта) выпустил новую шикарную вещь.

Omost - https://github.com/lllyasviel/Omost

Это LLM (большая языковая модель), которая по вашему запросу создаёт крутейшую картину с максимальным вниманием к деталям. Что бы было понятнее, принцип как у Dalle-3: вы даёте короткий промт (или максимально развёрнутый, по желанию), а ЛЛМ очень подробно расписывает ваш запрос, раскладывает его на составные части, планирует как всё это будет выглядеть в общем и в частностях.
Если интересно в подробностях, загляните на страницу, Иллия расписал всё сверхпонятно: как описывается начало, как разбивается на регионы, каким образом редактировать растояние до "зрителя", развёртка каждой части промта. После подготовительного этапа вся эта информация отправляется на генерацию. По умолчанию используется чекпоинт XL RealVisXL_V4.0 но можно подкинуть ему любой (в формате Диффузерсов). "Подготовительные" ЛЛМ, кстати, тоже стандартные (ллама-3, phi-3 и дельфин 2.9), единственное что - им требуется специальная дотренировка.

Выше я приложил картинки, которые получаются у Omost. Первые сделаны по простым промтам (битва тысяч орков и людей у города, орк бежит возле рушающейся стены, эльфийки плывут, идут вброд по реке), а следующая - подробно описана (цвет штанов, куртки, футболки, надпись на ней, ночной город с многоэтажками, стилистика аниме/не аниме). Конечно, проблемы нейросетей никуда не делись, но следование промту и внимание к деталям очень хороши.

Как же всё это потрогать, спросите вы?
Во-первых, есть готовая демка на Обнимашках. Работает она быстро (к тому же, абсолютно бесплатно и без ограничений), но порой не хочет рендрить картинку. Тут претензия к самим обнимашкам, да. Где-то 5 из 10 запросов у меня отработало нормально.
И конечно же, Иллия не был бы собой, если бы всё это не было доступно локально! Ссылка на инструкцию по локальной установке. Пройдёмся по пунктам.

Во-первых, естествинно, вам нужен Питон. Автор рекомендует 3.10.хх, соответственно, скачиваете 3.10.6 или 3.10.11 (что бы точно всё заработало). Если вы скачаете последнюю версию - ничего не заработает!
Далее нужны установленные git и Анаконда для 3.10.
Поставив всё в такой очерёдности (не забывайте обязательно ставить галки "добавить в ПУТЬ" и "интеграция с питоном" где они есть), открываем Anaconda Prompt (miniconda3) появившуюся у вас в Пуске и поочерёдно выполняем строчки инструкции на странице выше. Когда всё скачается и установится (5-20 минут) откроется ваш браузер по адресу http://localhost:7860 где будет простенький интерфейс для работы.

Что по памяти? Тут всё отлично, "базовая" ллама-3 q4 спокойно входит в 8 гигабайт VRAM (Скриншоты выше - во время работы ЛЛМ), ну а картинки рисуются на XL, что так же спокойно помещается там же.
На моей 3060 предварительный этап (развёртка через ЛЛМ) занимает где-то полторы-две минуты, рисовка картинки 1536х896 - секунд 40 без Хайрес-фикса и 3-4 минуты с ним.

Интерфейс, пока, максимально простой - нет ни смены чекпоинта, ни семплеров, ни сохранения картинок, ни даже батника запуска. Очень надеюсь на сообщество, что это нам быстро прикрутят :) Но если вы хотите пощупать одним из первых - то уже можно.

Читать полностью…

Stable Diffusion | Text2img

10 Mar 2024 16:42

🌟 Боты от DeepFaker 🎚️

• DeepPaint Telegram Bot
Бот для работы с фотографией.
- Замена лица на фото.
- Улучшение лица.
- Улучшение фулл фото.
- Удаление фона на фото.
Работает бесплатно, в порядке общей очереди.

• MidJourney Telegram Bot
Бот использует алгоритмы MidJourney, а не аналоги, поэтому полностью платный.
- Простая оплата из РФ.
- Доступны все режимы генераций.
- Адекватные цены.
- Быстрая генерация.
- Доступна 6 версия MidJourney.

• SlookBot
Твой персональный ИИстилист.
- Загружаем фото.
- Пишем запрос.
- Оцениваем себя в новом образе.

😃 Все наши ресурсы и боты:
@qrcode

Читать полностью…

Stable Diffusion | Text2img

22 Feb 2024 16:02

🥳 Stable Diffusion 3.0

Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image.

Улучшено качество изображений, улучшено написание текста
(?! смотрим прикреплённую пикчу), более высокая производительность и тд.

На данный момент доступ через лист ожидания.

• Подробнее

Читать полностью…

Stable Diffusion | Text2img

20 Feb 2024 16:47

💻 Генератор изображений с удобным интерфейсом.

Энтузиаст запилил приятный интерфейс для нейронки GLIGEN: тут есть поля для рисования, подсказок и настройки — всё просто и доступно.

Нейросеть известна тем, что может генерировать объекты по текстовой подсказке в заданных вами областях и поддерживает различные стили.

• Github
• Подробнее
• Попробовать на HuggingFace

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

14 Feb 2024 17:39

🧑‍🎨 Новинка от Stability AI.

Вышла новая модель Stable Cascade для генерации изображений по текстовой подсказке. Процесс занимает пару секунд, а на выходе получается детализированная пикча, не уступающая по качеству SD XL. Плюс нейросеть может генерить даже текст.

Бесплатно, промпты понимает только на английском языке.

• Попробовать
• Colab (Free)
• Подробнее

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

20 Jan 2024 19:01

👩🏼 Создаем свою ИИ-фотомодель.

Всё чаще в новостях мелькают нейромодели, которые зарабатывают сотни тысяч долларов. Оказывается, создать свою — дело пары минут.

— Регистрируемся на сайте RenderNet;
— Нажимаем кнопку "Goto Studio", выбираем "Epic Realism" и придумываем текстовую подсказку с описанием внешности девушки;
— Получаем изображение и кликаем "Facelock", чтобы сохранить референс лица для следующих генераций в разной одежде/ракурсах/локациях.

Бесплатно можно сделать 50 генераций.

• Попробовать

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

17 Jan 2024 17:38

📹 Контроль движения камеры на видео.

Tencent выпустили MotionCtrl — унифицированный и гибкий контроллер для эффективного управления движениями камеры и объектов в сгенерированных видеороликах.

MotionCtrl можно развернуть на LVDM, VideoCrafter1, AnimateDiff и SVD.

• Подробнее
• Попробовать

#иинструмент

Читать полностью…

Stable Diffusion | Text2img

16 Jan 2024 18:27

🎞 ИИ-трейлер для реального сериала.

Команда из 3 человек работала около недели над созданием реалистичного трейлера с помощью Stable Video Diffusion.

Посвящается всем, кто любит подумать о Римской империи ☕️

Читать полностью…

Stable Diffusion | Text2img

29 Dec 2023 15:00

Немного свежих концептов.

1) Фейерверк-арты! Нарисует ваш промт в виде праздничного фейерверка 🎄🎇🎆 SD XL.
2) Луковичный стиль. Для луколюбов! SD XL.
3) Интерьер автобуса. Реалистик и Аниме. SD 1.5.
4) Генератор изометрических сцен из игр. SD 1.5.
5) Генератор концептов домов в европейском и американском стиле. SD 1.5.

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

27 Dec 2023 10:29

Лоры-концепты.

1) Оружие в стиле Fallout 3+. SD XL.
2) Летающие корабли и острова. SD 1.5.
3) Футуристичные небоскрёбы и застройка. SD 1.5.
4) Момент вручения вам подарка ❤️ SD 1.5.
5) Качественная стилистика художника WLOP для SD XL.

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

26 Dec 2023 15:15

Непостоянная рубрика "для геймдева"

Генератор кнопочек, бейджиков, табличек и т.п.

Хватает простого промта, Лора следует указанному в тексте цвету и особенностям.
Ссылка (SD 1.5) — https://civitai.com/models/243262/mwbutton

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

26 Dec 2023 03:59

Ещё один предновогодний подарок от авторов - релиз AniVerse v1.6. Это одна из лучших (может и лучшая) анимешных моделей (SD 1.5) для тренировок Лор и работы с Лорами.
Ссылка — https://civitai.com/models/107842

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Stable Diffusion | Text2img

25 Dec 2023 06:11

Немного "плёночных" стилистик.

1) Полароид-снимки. SD 1.5.
2) Шикарнейшая Лора имитирующая "стиль" Kodak Motion Picture Film. Модель построит крутую кинематографичную сцену, добавит ярких деталей и "прилижет" композицию. SD XL.
3) Имитация цветного CRT TV. SD 1.5.

Обсудить / пообщаться
Наш чат @text2image

Читать полностью…

Subscribe to a channel