12766
Дизайн и искусство в Blender и в AI Тренирую модели, людей и себя Поддержать канал — patreon.com/monkeyinlaw_patreon Стрим канал — https://t.me/motivationarts https://linktr.ee/monkeyinlaw — Связь Чата в канале нет с 13.07.2025
Тут Денис пробовал Veo 2
🐈⬛ Я живу в бедной Сербии, да и сам не богат. Потому я так же попробовал Veo 2 от Google DeepMind и поделаюсь вам ссылкой где пробовать дешевле:
На Fal.AI — 5 секунд стоят 1.25$ + 0.25$ за каждую следующую. (А зачем мне 8 секунд для тестов? Когда по 5 все можно понять)
А теперь переходим к тестам. Для промптинга я взял статью от гугла про Veo 2 и заметил в их примерах стиль T5XXL(спасибо FLUX), не долгая думая этот вариант для промптов и возьмем.
Для тестов я создал себе бенчмарк из таких сцен:
1. Коллажная анимация в стиле Граффити
Интересно как Veo 2 работает с нестандартной анимацией и коллажами
2. 3D рендер мистического существа с Оленем наездником в доспехах, на заднем плане много планет и звезд
Это отсылка к этой работе
3. Сцена в кафе, где один из героев проливает чашку кофе
Я видел как все радовались физике в Veo 2, давайть проверим сцену, которую можно легко снять в реальности, то есть супер простая задача для продакшана
4. Сцена, где персонаж делает двойное сальто на батутах
А вот эта сцена хоть и не простая, но достаточно важная для боевиков, где нужно подчеркнуть, что наш персонаж изи делает сальто отстреливаясь от всех. Ну и конечно же сила трансформеров в Veo 2, позволит перенести это двойное сальто потом на других персонажей, верно? Что может пойти не так?
Промпты целиком в комментариях
☺️ Наверное из всего что получилось, мне больше всего понравилась коллажная анимация. Возможно если сильнее доработать промпт и, например, задача сделать заставку для youtube канала или перебивку, или заставку для сторис из поездки, этот бакс выглядит неплохой тратой.
😐 Про сальто — это будет проблемой для всех text2video моделей. Из двух попыток, каждая ужасна. И так будет очень часто из-за проблем с даткой и архитектурой видеомоделей. А у меня в том же ютьюбе, столько видео про андеграунд соревнования на батутах. Но видимо эти данные не брались в обучение (что наверное хорошо) или не размечались вовсе. А сцену, которую я скину в комменты интересно когда сможет получится в видеомоделях, например, с миньоном персонажем?
Финал
💰 В моем случае тесты стоили 11.25$ (Столько же в моем бюджете стоит купить еды на два дня для двух человек в Lidl)
Для создания анимационного арта я пожалуй выберу Blender.
Андрюха, у нас Улица разбитых фонарей, но это аниме.
Результат моего теста Luma Ray 2.
Валентинки через Glif
Теперь каждый глиф стоит по-разному, но на старте вам дают 30 кредитов бесплатно и так же они ежедневно пополняются. А я подготовил для вас Глифы для Валентинок!
💰 В среднем 1 генерация в моих глифах тратит ~8 кредитов
💰 Оригинальный Glif — ~5 кредитов
Готовые глифы для Валентинок:
► angrypenguin/glifs/cm72g4nie0006rz8l6kxmh1es">Оригинальный Glif — откуда я взял идею, генерирует картинку + милый текст через Sonnet. Из минусов — вотермарка.
► MonkeyInLaw/glifs/cm72vf4y70002rv29eqvreat1">Мой вариант. 2:3 размерность (1200x1600px) — Идеален для печати!
НО! Есть особенность сделал его с разделением промпта для Clip L и T5XXL.
Мне помогает вот этот промпт для любой LLM: Create prompts based on text for Clip L and T5XXL. Text: [Ваше описание или картинка]
Если не хочется заморачиваться с промптами для Clip L и T5XXL, просто вставьте одинаковый текст в оба поля.
► MonkeyInLaw/glifs/cm74j1nbd000srhb5t1jjczrs">Вариант с возможностью референс картинки. Добавил Redux туда.
► HF Lora — для тех кто хочет локально погенерить
— Я распечатал эти открытки на акварельной бумаге, и они выглядят как настоящая пастель!
👍 Так как набралось больше 10 звездочек собрал для вас Glif с Redux. Жаль у Glif нет возможности использовать PULID FLUX, а жаль как раз вышла недавно вторая версия. Напомню, PULID FLUX -- качественное переносит лица на генерации.
📕 Ещё собрал вам поиграться на разных LLM для описания промпта, можете потестить разницу тоже:
— GPT4o (Самый быстрый, но есть цензура)
MonkeyInLaw/glifs/cm6b3scfc000sbu4ha4o9p6gf">LINK
— На Deepseek R1 (Работает на уровне 4o)
MonkeyInLaw/glifs/cm6b6757c000r1058ibfegcg2">LINK
— Gemini 2.0 Flash (Часто падает, видимо большие лимиты по API у Glif)
MonkeyInLaw/glifs/cm6clowo2000cy4subzf4puas">LINK
— LAMA 3.3 70B (Хуже всего работает по визуалу)
MonkeyInLaw/glifs/cm6clpzqn000evtfpp9tlctnx">LINK
— И экстра глиф, куда можно закидывать сразу два изображения на стиль и мешать стили.
MonkeyInLaw/glifs/cm6ckzmv5000ba4hr2cvrkczj">LINK
📕 Сила картинки ~0.6 - 1 для хорошей генерации.
Из-за того что промпт усложнил и использую Redux, иногда генерируется просто персонажи, без упаковок. Эту проблему чуть решила Лора.
В целом не зря вспомнил про Glif, на нем всегда приятно бесплатно собирать что-то в связке ComfyUI + LLM и сразу показывать в свет. Потому что даже на Gradio такое собрать займет 1-2 дня и 10-20$ на бэкенд сервер за день.
Спасибо за звезды и реакции в прошлом посте, приятно!
Небольшой дайджест
🔥 Интересный анализ работы Devin (frontend агента), ребята провели много тестов:
— Что получилось:
* Интеграция API — извлечение данных из базы Notion в Google Sheets.
* Из 20 задач успешно выполнены только 3, при этом схожие задачи давали разные результаты.
* Проблемы с пониманием и модификацией уже написанных проектов.
* Выявление множества ложных уязвимостей.
* Некоторые задания занимали дни вместо ожидаемых часов.
Итоговый пост
В этом году этот канал не был активным. Планирую менять вектор канала в более личный в новом году!
Лучшее за год для меня: Нажмите на первый пункт, чтобы развернуть весь текст
— FLUX опенсоурсный генератор картинок.
я до сих пор не могу понять где границы в его генерациях
— RUNPOD аренда GPU под свои задачи. в этом году слез с COLAB и перешел полностью в Runpod
— COMFYUI продолжает развиваться и уже стал для меня основным инструментом ресерча и работы с разными новыми и старыми моделями.
Но в этом году пока не создал свой уютный генератор для всех с фронтом и бэком, переношу это на следующий год.
— 4090 И L40S видеокарты года для меня. Именно этими двумя видеокартами я чаще всего пользовался и делал на них бенчи по вместимости и производительности.
— Я вернулся к 10 км беговым дистанции, конечно тем 6 минут на км полная грусть для меня, когда в голове воспоминания про темп 4:40 минут на км. Для тех кому не понятны цифры, олимпийские чемпиона бегают ~3 минуты на км, подростки с опытом бега ~5,6 минут на км, любители бега ~4-7 минут на км.
эх, а 3 года назад был забег в 111 км и средний набег в 60+ км в неделю
— Вернулся к посещению батутов, а именно полноценные упражнения на координацию + сальто разные
— Велосипедные прогулки по городу и за продуктами, для меня переезд в Нови-Сад впервые показал что такое доступная среда для велосипедистов. + купил супер удобную сумку на велосипед
— Связка ObsidianMD + Linear. В данном случае первый служит личной библиотекой, где есть корневые знания и быстрые идеи. А второй позволяет смотреть сколько задач успеваешь сделать и как простые задачи оказываются совсем не простыми иногда в них десятки под задач
— Cricut как артовый плоттер. Впервые написал небольшой код и отправил рисовать ручкой во что-то физическое, в данном случае плоттер. Подробнее тут: LINK
Нейронное творчество:
— monkeyinlaw">Youtube. Вновь подснял немного уроков и конечно вернусь к каналу в январе. Patreon получит видео раньше!
— Стримы. Ура, теперь я оффициальный партнер Twitch, хотя контент узкоспециализированный, спасибо что заглядывали и творили со мной.
Вы заметили, что активность тут упала, все это время была подготовка к сильной трансформации канала. Для вас наверное ничего не поменяется, но я сильно упростил процесс создания постов. И подготовил множество темплейтов для постов
— В начале этого года я начал встречаться с очень творческой девушкой. А так же получил первого хейтера этих отношений — её биполярное расстройство. Впервые я узнал насколько это скрытая и ужасная болезнь, у которой индивидуальное лечения для каждого...
— В этом году было много путешествий по Сербии, много разных арендованных машин. Я могу часами обсуждать машины и велосипеды
— Много приятных прогулок с близкими людьми и семьей в новом месте (что особенно важно для меня)
-- Сложный переезд из квартиры в квартиру, использовал для этого 20 выездов на велосипеде и один раз заказал такси. (я обожаю что-то делать максимально не стандартными путями)
— Ресерч это пожиратель вашего времени, настроения и денег. Вот бы все создатели моделей показывали не только черри пик результаты, но и варианты, где все будет ужасно.
— Подписки в 100 + баксов от многих сервисов
— Gaussian splatting в Блендере, так и не появилось для него адекватного плагина и возможность взаимодействовать с ним, как в Unreal Engine. Пример, как сейчас это выглядит в Blender.
— Видеонеронки для продакшена. Проблемы:
- Качество (в среднем 1280x768 или меньше)
- Контроль (только-только появляются ControlNET для видеонейронок)
- Никак быстро не отредактируешь результат. Нужно сделать ещё 100+ генераций и не факт, что повезет
Наглядный пример: Автор сделал картинку за 5 секунд в MJ, анимировал в Runway и затем часами в After Effects делал адекватную продакшен анимацию.
- Мой первый музыкальный нейронный альбом. Который в итоге прошёл все проверки и находится в spotify. Youtube.Читать полностью…
Во Flux, недавно вышел аналог Ipadpater, только он Redux.
Не открывайте перед сном
Тренировка Лор для Клинг!
На своих (чужих, нужных) лицах.
Да, в Клинге появляются Лоры - они их зовут "AI Custom model"
Для тренировки своей модели:
Вам потребуется сделать горизонтальный ролик, где вы смотрите в камеру продолжительностью 10-15 секунд, в формате 1080p и размером менее 100 МБ. На заднем плане не должно быть других кожаных, и убедитесь, что это HQ с хорошим освещением.
Ну а потом загрузить в Клинга 10-30 таких (!разнообразных!) роликов. Важно держать длину 10-15 секунд на ролик, качество 1080p и отсутствие людей на заднем плане. Они рекомендуют загружать от 10 до 30 роликов. 20 тоже ок.
Тренинг идет всего 15 минут (это пока все непонаехали). А потом у вас появляется Face Model в text-to-video option.
Пишете промпт: [facemodel] wearing cyberpunk armor and holding a futuristic rifle. Inspecting a dark laboratory. Lantern lights, dramatic atmosphere.
И все, Клингонская Лора в действии!
Поглядите примеры. Этот ж новый нормальный кастинг.
Вместо базы актеров - база Лор. Кем играть сегодня будем? Так, для испанского проката натренируйте Пенелопу Крус, благо материала полно.
@cgevent
Для mochi запилили редактор mochi comfyui video2video ноды. Заводится локально на 24гб vram.
До runway далеко, и на длинном контексте скорее всего будет разваливаться, как animatediff/svd
Но начало положено, и если кто-то присобачит туда хаки для длинного контекста, будет и у нас runwayml дома!
comfyui mochiedit
comfyui mochiwrapper
@derplearning
Нови-Сад
📕 Это бруталистические государственные здания в сочетании с известными нами панельками, которые невероятно контрастируют с оборонительными крепостями и историческим центром времен Австро-Венгерской империи.
🧐 Для меня это место, которое я часто представлял себе, как город мечты.
🐈⬛ Я рад, что есть возможно показать его таким, как я его вижу в своем воображении. Пока не так детально, но как концепт очень хорошо выходит.
📕 Workflow: Midjourney Editor для реальных фото + RunwayML Gen3 turbo для оживления статики
Заставка Улицы разбитых фонарей, но это Улица Сезам.
Сделал довольно проклятое, прогнав золотую классику через video-to-video #gen3. Специально не занимался черрипикингом, потому что галлюцинации здесь прекрасны. Не о чем не жалею.
Берем производную от мемов.
Отдельного поста заслуживает совершенно мемная фича в новой ПИКЕ 1.5 по названием "раздави(сомни в труху) это"
Мемная, потому что эффект как бы один и быстро взлетит и быстро надоест.
Зато можно брать мемы и мемно над ними издеваться. И не только над мемами.
Знаете какой тут сложный промт, инфоцыгане?
Image to video prompt: 'Squish it'
@cgevent
https://huggingface.co/glif/how2draw
крайне любопытная lora how2draw
Ценность опенсурса в возможности FT. На апи и подписках зарабатывают и окупают модели еденицы, а ценность которую можно утащить из опенсурса велика - хороший пример это SD комьюнити которое стало автономно от моделей и создало столько инфраструктуры что можно конкурировать с MJ(особенно если знаешь что нужно)
Вчера на стриме потестил vid2vid
И конечно не все так радужно, как пишут и показывают.
В примерах я использовал быстрые 3d генерации по картинке и затем собирал сцену в Blender. Пока генерации были с обычными ракурсами камеры и движениями, все были идеально. А как только я выбрал более экзотические ракурсы и движения камерой, генерация поплыла. Даже при силе 0.1, где практически должна быть моя исходная генерация - цвета и движения были ужасными. Как и всегда, магии нет, чего нет в датасете, того не будет при генерации.
🧑🎓 Первая генерация - простая сцена в Блендер с 3d болванками
🧑🎓 Вторая генерация - лучшее что смог собрать в vid2vid runwayml
🧑🎓Третий ролик - исходник, генерация с силой 0.7, и генерация с силой 0.1 (чем меньше, тем больше похоже на оригинал входного видео)
Запись стрима: LINK
FLUX LORA PERSON
📕 Сделал новый урок про обучение Лоры на персонажах. В видео два способа обучения и инференса(бесплатный на Tost.AI и на Runpod), оба варианта обучения используют AI Toolkit.
📕 Основное различие в конфигах, их можно найти на бесплатном патреоне:
— Стандартный — позволяет обучить лору на персонажах с хорошей схожестью
— Обучение двух слоев и четырех слоев только — скорость инференса увеличивается, размер лоры в размере 6-8 мб, концепты проще соединяются с нашим персонажем, но есть небольшая потеря в схожести и качестве.
🔄 Отдельно конечно мне понравилось делать обложки между главами. Они как раз в превью.
PATREON LINK — YOUTUBE LINK
И еще новости:
📕 Сравнение ControlNet для FLUX.
LINK
Вывод: Лучше всего себя показывают
🔥 MistoLine для линий и Depth из UnionPro для глубины
📕 Подробное и качественное сравнение скорости генерации на разных семплерах.
LINK
Что самое сильно, тесты делали на RTX2060 SUPER 8GB VRAM. 8gb + и 55 секунд на генерацию, это конечно приятная новость для всех у кого слабые GPU.
🔥 Тренировка концепт слайдеров теперь доступна и для Flux! Концепт слайдеры позволяют значением веса менять эмоции, возраст или другой предобученный параметр в генерациях Ждем в ComfyUI
LINK — NOTEBOOK
🔄 Обратил внимание на тестах, что многие художники из SDXL прекрасно генерятся и во FLUX, большие базы данных по художникам для SDXL:
LINK 1 | LINK 2
Когда смотришь как работает твой сложный код в реальном продукте полностью написанный Нейросетью
Original
Пару недель назад посмотрел мульт Flow — это тот, который про кота и потоп.
Неожиданное и запоминающееся открытие года. Основная его фишка в том, что он вообще без слов, что особенно удобно, когда ищешь в чужой стране, что посмотреть, хотя бы на английском.
Фишечка именно в отсутствии диалогов. Мозг и нейронная активность при таком просмотре активируют не только зрительную кору, но и области, которые связаны с визуальным восприятием и обработкой эмоций.
В мульте, наверное, есть только один момент, который позволяет выдохнуть, всё остальное время находишься в напряжении.
Что интересно, режиссёр Gints Zilbalodis писал сценарий 5,5 лет, пока инвесторы искали финансирование, а закончили они его за пару дней до отправки на Каннский фестиваль. После этого мульт получил Золотой глобус и сейчас номинирован на Оскар как лучший анимационный фильм.
Кроме очевидных отсылок к дружбе и взаимовыручке, лично для себя увидел пару моментов, связанных с миграцией, кластеризацией обществ, разделением на «свой-чужой», оставлением своего дома и вообще всего, к чему привязан.
Обратите внимание на покидание дома лемуром.
Мульт сделан в Blender, поэтому отдельно было забавно наблюдать в начале на фигурках котиков модификатор Decimate с воксельным режимом упрощения. 😀
Pika labs конечно что-то невероятное сейчас делает в видео моделях
Кто-нибудь уже пробовал? Интересно сколько разрешение на выходе, как много кадров можно сделать.
Link
Принес вам поиграться бесплатный генератор игрушек в упаковке.
🔥fab1an/glifs/clztnjc36000gg1mi9bmlautm"> Закидывайте фотку, короткое описание и получаете фотку упаковки игрушки.
20 генераций бесплатно в день. Если не дает зарегаться — используйте VPN.
📕 Под капотом — GPT4о vision + Flux Dev с лорой на игрушки.
— Можно доработать, если PuLID FLUX встроить, тогда схожесть лица будет круче.
И покидайте что получилось в комменты. Много мемов не поделать из-за цензуры ChatGPT и описания референсных картинок только через LLM. Если закинет кто 10 звезд, сделаю на PulID(или Redux) генератор.
fab1an/glifs/clztnjc36000gg1mi9bmlautm">LINK
О проектах!
Не часто пишу тут про что-то связанное с моей работой, но у нас потрясающая новость!
Я буквально недавно присоединился к команде Mago и сегодня официально:
Рады объявить, что Mago привлек €1,5 млн на этапе pre-seed финансирования под руководством Atlantic Labs!
Наша цель — революционизировать творческие процессы в анимации, кино и игровой индустрии, сделав профессиональные инструменты для преобразования видео с помощью ИИ доступными для всех. Опираясь на успех WarpFusion (150+ миллионов просмотров) и удивительную работу Derp Learning, мы разрабатываем мощные инструменты, которые позволяют превращать любое видео в любой визуальный стиль с полным сохранением творческого контроля.
Представьте, что вы можете преобразовать реальную съемку в потрясающую анимацию, масляную живопись или любую эстетику, о которой только мечтаете — при этом затратив лишь малую часть времени и средств по сравнению с традиционными методами. Это только начало нашего пути по поддержке создателей по всему миру.
ПОДРОБНЕЕ ТУТ
Думаю старичкам AI генерации не нужно долго рассказывать про WarpЧитать полностью…
Runwayml: анонсирует camera controls, успевает похайповать полчаса.
Опенсорс: hold my beer
DimensionX Lora для Cogvideo. Моё увожение!
Github
Опенсоурс управление видео
Продолжаем тему с видеогенерацией.
📕 Еще на прошлой неделе на стриме попробовал:
— ComfyUI CogVideoXWrapper — для гибкого управления видео с поддержкой масок лица, контрольных точек и карт глубины.
Для работы с траекторией:
GITHUB—COMFYUI_JSON_T2V—COMFYUI_JSON_I2V
Если нет возможность использовать Kling с его motion brush, но есть видеокарта 24+ GB, то это наверное самый качественный инструмент.
🔥 Еще конечно ждем для ComfyUI:
— VEnhancer — для улучшения качества видео после генерации. Чтобы наконец-то получить адекватный HD.
Oasis: Вселенная в трансформере
🔥 Oasis — это первая в своем роде игровая модель, полностью генерируемая нейронкой в реальном времени. Она позволяет пользователям взаимодействовать с виртуальным миром, где все элементы, включая физику, правила игры и графику, создаются и управляются нейронкой.
📕 Основные особенности Oasis:
— Пользователи могут перемещаться, прыгать, подбирать предметы, разрушать блоки и выполнять другие действия, взаимодействуя с миром, созданным ИИ.
— Вся игра генерируется на основе фундаментальной модели, без использования стандартных игровых движков.
— Oasis понимает и воспроизводит такие элементы, как строительство, физика освещения, управление инвентарем и взаимодействие с объектами.
📕 Технические аспекты:
— Oasis состоит из двух частей: пространственного автоэнкодера и диффузионной модели на основе трансформеров. Автоэнкодер основан на ViT, а основная модель — на DiT.
— Модель обучалась на открытых видеоданных Minecraft, собранных OpenAI, с использованием метода Diffusion Forcing, что позволяет генерировать последовательные кадры с учетом пользовательского ввода.
— Команда Decart создала оптимизационную инфраструктуру для модели Oasis, так как стандартные методы для LLM были неэффективны для архитектуры DiT: В современных моделях текст-видео, таких как Sora, Mochi-1 и Runway, на генерацию одной секунды видео может уходить до 10–20 секунд, даже при использовании нескольких GPU. Оптимизация Decart позволило улучшить использование GPU и минимизировать задержки, масштабируя модель для многократного использования GPU и сокращая время передачи данных.
☺️ Код и веса модели Oasis доступны для локального запуска, а также есть демо:
INFO—MOREINFO—GITHUB—WEIGHTS(HF)—DEMO
🐈⬛ А вот пользовательский опыт от меня:
— Это наверное самая триповая игра в которую я играл, вещи трансформируются во время перетаскивания, как только ты выбираешь камень, который рандомно сгенерировался в инвентаре и уже мечтаешь построить каменный дом, он тут же превращается в дерево.
— Милый цветочек при выборе ставит деревянное ограждение.
— Можно легко телепортнуться просто посмотрев вниз и вновь вперед.
— Вода, сундук сразу же вызывают критическую ошибку и тебя выбивает из сервера.
🐑 Идеальный симмулятор насколько хаотична жизнь.
Основной вывод от меня:
Оптимизация видео моделей невероятно развивается и скоро мы получим много опенсоурс моделек, которые смогут генерить 20+ кадров в реалтайме, еще и триповых игр. Еще больше мемов и абстрактных видео + игр. Но если мне нужно будет сделать что-то точное, что требует сохранение структуры A и положения B, я пойду делать это стандартным способ. (Blender, After Effects, Unreal Engine и так далее + предыдущее поколение уже хорошо контролируемых нейронок)
Бу, это тест нового инструмента Editor в веб-версии #Midjourney, который наконец-то позволяет:
а)расширять или инпейтить загруженные изображения
б)переделывать их, сохраняя контуры (по сути ControlNet с Depth). Картинки с котом посвящены этому пункту, как самом интересному.
Вроде все это уже давно есть в других инструментах, но тут MJ наваливает своего традиционное КАЧЕСТ-ВО 👍. Ну и работает со всеми старыми настройками и приемчиками, что обеспечивает некоторую гибкость (тут закадровый смех фанатов Stable/Flux).
Потестить пока только можно если у вас от 10к генераций (которых у меня оказалось больше).
FLUX PRO 1.1 on GLIF
📕 Многие уже писали [ LINK1 LINK2 LINK3 ] про Blueberry, который на данный момент бьет все бенчмарки по качеству картинок. (А если вы в ComfyUI все новшества поставите на Dev, ойойой, жаль такой версии нет в бенчмарках...)
🔥 Можно потестить 20 генераций в день на глифе, или пойти сделать свой глиф, подцепить туда Claude для аугментации промпта и получить Flux 1.1 на стеройдах — angrypenguin/glifs/cm1to7ws0000gnlxccqgp1gt0">LINK (Если из РФ, требуется VPN для регистрации иначе будет waitlist окно)
А я пока в этом месяце минимум по постам, кстати, почистил канал от ботов, и это была трудная задачка. (- 100 ботов и людей, кто не заходил последний месяц в тг)
Вывод: Телега сама удаляет неактивные каналы и боты.
CogView3 & CogView-3Plus
В целом осень выдалась урожайной, в основном благодаря ECCV & SIGGRAPH ASIA
Вот и китайцы выкатили очередную итерацию CogView text2image
Если верить авторам, бьет SDXL во все поля (пора все-таки уже с FLUX сравнивать, сдохле второй год пошел)
paper
code
@derplearning
Дайджест за неделю по нейронкам
🐈⬛ Animatediff Unsampling — новый вариант застабилить мерцание на генерация. При всех крутых возможностях RunwayML. Animatediff для меня пока остается самым артовым инструментом с возможностью сильного управления генерации. В превью пример генерации.
LINK — LESSON
🔝 Img2video CogXvideo — CogXVideo опенсоурсный аналог Dream Machine, KlingAI и Gen3. Теперь доступен и в варианте Img2Video. Умельцы уже смогли сделать возможность генерировать разные размеры. Но по качеству чекпоинт Fun 5B делает намного интереснее генерации, чем стандартный чекпоинт.
LINK — Fun5B_example — ComfyUI-JSON-Fun5B — Fun5B-WEIGHTS — CogXVideo10GBPipeline — EXAMPLE
🥰 Tripo AI — новый шаг в 3d генерациях. Качество генераций не уровня продакшена, но отлично сойдёт для 3d печати. Дают 600 кредитов, генерация стоит 25 при условии, что вывод в glb формате, для других придётся отдать ещё 10 кредитов. Качество на домах и персонажах невероятное! Сцены по одной картинке таким способ генерить не получится :/
В примерах есть вариант 3D печати сразу после Tripo, картинка генерировалась во Flux.
LINK — 3D-PRINT
📕 Настройка блоков трансформера во FLUX. Матео в своим последнем ролике(Attention Seeker часть) показал новые ноды для работы с блоками. Коротко — пока нет явных зависимостей, но если их понять — то управлять генерациями станет еще проще!
EXAMPLE 1 — EXAMPLE 2
👀 Kling AI. Клинг обновился до версии 1.5 и добавил новых инструментов: Motion Brush — создание масок для нужных предметов и выбор их движения. Правда в версии 1.5 новые инструменты не доступны, как и возможность ставить первый и второй кадр. Возможно только генерировать в text2img и img2img, да еще и за минимум 35 кредитов(Так как доступен только проф вариант для 1.5) и только в платной версии…
KLINGAI
☺️ Gen3 новинки — вертикальные видео.
RUNWAYML
📕 Три очень качественных каналах на английском по ComfyUI:
— Серия уроков по ComfyUI: LINK
— latentvision" rel="nofollow">https://www.youtube.com/@latentvision
— sebastiankamph" rel="nofollow">https://www.youtube.com/@sebastiankamph
p.s. Пилю для вас дайджесты в 30-ти летний юбилей
Как определить AI генерацию
📕 Недавно в сообществе Reddit по Блендеру, появилась невероятная работа. И многие стали выгонять автора из треда за использование видеонейронок вместо Блендера. ⚠️
😳 Автор работы, Александр, был вынужден предоставить скриншоты, чтобы доказать, что его работа полностью создана в Blender.
Если вы хотите научиться отличать нейронные генерации от классического 3D-арта или видеоряда, обратите внимание на следующие признаки:
🔍 Ткани и движущиеся линии — Смотрите на ткани, движущие линии, например, на траву как в видео. Если визуальные линии создающие объекты прерываются или перетекают друг в друга, то работа явно сгенерирована.
🔍 Анатомия — Наблюдаем за руками, ногами, другими частями тела, особенно если они двигаются часто. Именно в частых, быстрых генерациях любая видеонейронка теряется. Ноги превращают из правой в левую, пальцы меняют порядок или сращиваются.
🔍 Частички — небольшие частички мусора, конфетти или других вещей будут морфиться, растягиваться и видоизменяться.
🔍 Освещение и тени — Обратите внимание на тени и световые эффекты. Они могут иметь неверные углы или неправильную интенсивность.
💀 Различение AI-генерации и стандартного 3D-контента имеет ключевое значение для понимания производственных возможностей и ограничений каждого подхода. Традиционный 3D-продакшн предоставляет высокий уровень контроля, точности и реализма, что особенно важно для сложных и уникальных проектов. В то же время, AI-генерация предлагает быструю и экономичную альтернативу, подходящую для массового производства контента с меньшими требованиями к детализации.
Работа офигенная! АВТОР
COMFYUI FLUX SVG
📕 Нода для ComfyUI с Лорой, которая позволяет делать SVG генерации.
COMFYUI custom node—LORA SVG
✔️ Отлично подойдет:
— Если вам нужна маленькая иконка
— Не важны детали
— Нужен самый быстрый способ получения SVG
❌ Не подойдет:
— Если вы будете использовать плоттер для рисования или проф инструмент, беда со слоями и качеством линий
— Если вы хотите делать анимацию или игры
🐈⬛ Json для ComfyUI в комментах
@monkeyinlaw