Небольшое сравнение старой стандартной и новой v4 модели генераций.
Понимание текста в запросе сильно улучшилось. А пингвины мне чем-то напоминают примеры из Imagen.
- довольно сложный промпт, но при этом два героя спокойно генерятся.
"A gnome and a robot playing chess in the park"
Рендеринг в реалтайме #instantNeRF в Blender.
InstantNeRF от NVidia позволяет из небольшого количество фотографий собрать реалистичную 3D сцену.
Автор добавил код в Блендер и показал насколько быстро с видеокартой RTX3090 можно получать результат.
При этом зону рендеринга можно ограничивать простейшими шейпами из Блендера, в данном случае кубом. Это значительно повышает скорость рендера.
Автор надеется в скором времени оптимизировать код для возможность соединять сразу несколько сцен в одну.
Снималось все на iPhone 14 Pro Max, в 4K и 60 кадров в секунду.
Для тех у кого есть IPhone 12+ с лидаром, можно попробовать Luma AI, Nerf упакованный в мобильное приложение.
Waitlist
Все чаще нейросети и Blender будут встречаться в одном предложении. А я пошел откладывать средства на телефон с лидаром =)
В Midjourney обновление, при выборе -v 4 модели происходит красота!
Советую попробовать все свои любимые промпты вновь, за наводку спасибо Александру
Google Presents: AI@ ‘22
Интересное новое видео с презентации от гугла, где совмещают алгоритм Phenaki и Imagen Video, с помощью объединения можно создавать прям из текстового описания видеоряд, в итоге картинка выходит цельной.
Запросы для видео примера:Синий шарик застрял в ветвях красного дерева.
Гугл на данный момент не дает доступ даже к Imagen, text2image модели схожей с Dalle 2 и Stable Diffusion. Но статьи google ai research впечатляют, вот краткий список:
Камера перемещается от дерева с одним синим шариком к входу в зоопарк.
Камера показывает вход в зоопарк.
Камера очень быстро перемещается в зоопарк.
Вид от первого лица на полет в красивом саду.
Голова жирафа появляется сбоку.
Жираф идет к дереву.
Камера приближает пасть жирафа.
Жираф подходит к ветке и срывает синий шарик.
Одиночный гелиевый синий шар с белой нитью летит к голове жирафа.
Жираф жует синий шарик рядом.
Камера поворачивается вслед за улетающим синим шаром.
Imagen - текст в изображения на диффузии
Parti - текст в изображения на VQGAN
DreamBooth - дообучение моделей с малым датасетом, сейчас по всему инету множется стартапы с DreamBooth архитектурой поверх Stable Diffusion, где в модельку SD можно закинуть себя, знакомых или даже своих животных
Imagen Video - текст в видео
Phenaki - текст в длинные видео, хотя статья анонимная, возможно это не от гугла.
И конечно же, то что я тестил последний месяц:
Dream Fields - текст в 3D, так же есть варианты обученные на SD, например, колаб Dream Fusion - 1 час на A100 и моделька готова.
Ожидаем релиза Imagen для сравнения на практике с основными сетками text2image. Если конечно когда-нибудь код и веса появятся.