За озвучку. Пост
У всех этих видеогенераторов есть общая черта.
Они генерят видео без звука.
Я уже постил разные работы, где по видео, например, гитариста, озвучивают то, что он играет.
Но, похоже, в этой области дальше всех продвинулся Адобченко (ибо мает датасеты, стоки, софт для звука).
Анонсировали забавную штуку MultiFoley (точнее обновили свои же работы).
Теперь ИИ не только восстанавливает звук из молчаливого видео, но и умеет его продолжать.
Также, теперь можно не только текстом описывать, как вы хотите озвучить, точнее, что вы хотите услышать на вашем немом видео, но и можно на вход подавать референсное аудио.
Поглядите пример с собакой: типа, хочу, чтобы псина на видео лаяла как мой мопс, вот запись мопса.
https://ificl.github.io/MultiFoley/
Привет с печатной машинкой, которая издает звуки клавесина, тоже впечатляет.
ИИ сам разбирается, как попасть в пальцы.
В общем у нас тут этакий металипсинк, где вместо лип - ворлд.
Ни о каком коде речь не идет. Это Адобченко. И это идеально ляжет к ним в продукты - помните, как они заполняют пустые куски на видео генеративом? Теперь будет и со звуком тоже.
@cgevent
🤖 ИИ и iGaming — в чем связь?
AI трансформирует индустрию, и знание его возможностей — ключ к успеху.
➡️ Поэтому тебе нужно подписаться на Owner 1win!
На канале ты найдешь:
⏺Анализ трендов — как AI меняет правила игры в индустрии азартных игр;
⏺Инсайты от экспертов — мнения лидеров рынка о будущем iGaming с использованием ИИ;
⏺Новые подходы к монетизации и привлечению игроков.
😍 Присоединяйся к Owner 1win и будь первым!
На правах рекламы
Ну, что, какая модель?
Меньше суток с момента выхода. Скоро миллион просмотров.
Но у меня ощущение, что половина моих подписчиков из коментов (а там щас лютые ребята подсобрались) сделают не хуже. И быстро.
В общем контент перестает быть The King.
ИИ завалит вас и ваши клипы любым трешом и размером.
Бренд is a King.
А контент is just Kling.
Нейродед забыл выпить таблетки и что-то ворчит, перевожу: клип отстой, подписчики в комментах показывают круче, и единственное, что влияет на просмотры - это то, что Канье Уэст.
Нейробезумныймакс на минималках, блэт. Докатились.
https://youtu.be/qeWutl38TQw?si=VVDKjKdZiC2H9Phi
@cgevent
Runway Frames
У ранвей появился свой генератор картинок и я очень рад:
- удобно, когда все под рукой. Сделал картинку, оживил.
- очень важно, когда для видео используются картинки одного стиля. И тут, как раз, есть такая возможность.
Если изучить галерею ранвей по их продукту с генераций картинок, то видно, что акцент идет именно на сохранение точного стиля, что дает возможность получать консистентный набор видеокадров. То есть кадров одного стиля, что при монтаже даст устойчивую и понятную визуальную картинку.
По качеству это не миджорни и не Flux, но давайте будем трезвыми - в целом качество очень даже.
Еще одна удобная фишка - обучение своего стиля: закинули 15 картинок (лучше больше) и генерируете дальше в своем стиле фреймы, а затем уже и видео.
В целом тренд на генерации картинк внутри ведеогенераторов активно развивается. Такое есть и у Luma и у Kling и у Minimax.
Но оно и здорово.
В идеале бы, когда «родные» картинки воспринимаются для последующей видеогенерации лучше и чище, но пока это не так.
Взял картинки из галереи ранвей и прогнал в турбо режиме видео, чтобы показать принцип работы.
Хотя у них в галерее есть прекрасные видео референсы. Делают с Alfa моделью без промта, поэтому на их видео видим толко приближение или отдаление камеры (специфика работы Альфа версии в видео без промта)
Китайский минимакс теперь не совсем не Мини!
Глубокое уважение к Китаю и их продуктам
Для любителей ИИ-дистопии (у нас таких полный чат!): теперь работодатели мониторят все действия сотрудников с помощью ИИ. Все ваши движения мышкой, история любого приложения и все напечатанное на клавиатуре в реальном времени анализируется. Если есть регулярные паузы по 60+ секунд без «осмысленной» работы, то на ковер к менеджеру.
Кстати, большинство сотрудников не в курсе, что такой софт устанавливается в офисах и почти на всех ноутбуках, которые «выдают» сотрудникам.
Так что, прежде чем ИИ вас заменит, он на вас научится и будет жестко карать за любое непослушание. 😂
Помимо всего прочего у Claude прямо супер с визуализацией, построением диаграмм и работой с пдф.
Становлюсь все большим и большим фанатом продукта.
Четверка обновилась
OpenAI чуть доработали свою Gpt 4o:
Творческие способности модели в написании текстов вышли на новый уровень — теперь тексты стали более естественными, увлекательными и адаптированными для повышения их актуальности и читаемости.
Кроме того, модель стала лучше работать с загруженными файлами, предоставляя более глубокий анализ и более детальные ответы.
На мой взгляд, ИИ нужен именно для этого, а точнее он помогает в том, чтобы мы скорее начали исследовать новые территории фантазии (читай сознания).
…Наш текущий мир - некая абстракция. Пусть и не ясно на каком уровне она начинается и где заканчивается эта иллюзия.
А появляется сейчас возможность летать внутри своей памяти, мысли, эмоции.
Раньше для этого нужно было исписать гору бумаги, отснять десятки километров видео пленки.
А теперь «вдохнул/выдохнул» и погрузил всех в мир своих ощущений.
Вот так, мне кажется, одним лишь «Ом» Бог и создал текущий мир.
Ну или нет 😉
Я думаю такого варианта монетизации нейросетей вы еще не видели 🤯
Недавно познакомился с человеком, который уже долгое время зарабатывает на создании девушек-моделей через нейросети.
Только одна модель, которую он делает в ИИ, в среднем приносит около 100.000₽ в месяц. А у него таких девушек уже 9 и 5 новых он запускает в ноябре!
У себя в блоге он раскрывает весь свой путь, суть заработка и дает бесплатно инструкцию, как начать. Переходите 👉 /channel/+9cJh0wUoGkE0MzZh
На правах рекламы
Лол, чувак хотел провести параллельное сравнение своей процедурной анимации с анимациями, созданными вручную на некоторых 3D-моделях животных из интернета.
Но что-то пошло не так. На самом деле так даже лучше
Ссылка на пост автора.
Все меньше общаюсь с GPT
А вот с Claude у нас прямо мэтч глубокий.
Почему так:
- Клауди супер структурный
- Логика и аналитика на высоте
- клауди умеет создавать прототипы приложений прямо по соседству с диалоговым окном - это просто Wow!
Ощущение, что общаешься с равным. Не нужно упрашивать быть умным или не забывать или быть более внимательным. С Gpt же постоянно приходится «упрашивать» быть нормальным.
Приложу цитату последней аналитики моего промта для приложения по Таро, где мы интегрировали ИИ, но нам не понравилось как был подготовлен базовый промт для интерпретаций карт и формирования ответа пользователю.
Давайте проанализирую ваш промпт по нескольким ключевым аспектам:Читать полностью…
1. Общий тон и характер:
- Сейчас промпт создает довольно агрессивный, "панковский" характер
- Акцент на "brutal truth" и "punch in the gut" может вести к излишне резким ответам
- "Merciless irony" и "dark optimism" - интересное сочетание, но может быть слишком экстремальным
2. Структура:
- Хорошо, что есть четкая схема интерпретации
- Требование конкретных предложений правильное
- JSON формат практичен для обработки
3. Проблемные места:
- "Battle-hardened" и "wicked" задают слишком агрессивный тон
- "Forcing clients to confront" может вести к неконструктивной конфронтации
- Может быть слишком много акцента на критике и сарказме
Предлагаю создать более сбалансированную версию, которая сохранит уникальность, но добавит:
1. Больше эмпатии при сохранении прямолинейности
2. Более тонкий юмор вместо "merciless irony"
3. Конструктивную правду вместо "brutal truth"
Поднимать настроение можно по разному!
Тесты с разными Ии приложениями 😊
Ссылка на ап
"я подгорел капитально. ЗА ДВА РАЗА VIDU понял полностью что я от него хотел".
Вынесу из коментов такое вот мнение.
Нам же интересно мнение тех, кто делает что-то руками, а не только твитторные видосы.
Привожу мнение Влада без купюр. И немного дискуссий - очень круто наблюдать, как разные инструменты для разных задач находят своих разных пользователей.
Я только что тестил весь день минимакс, клинг, ранвей и люму. И решил закинуть 10 баксов на Виду 1.5, подумал, хрен с ним.
ЭТО ЕДИНСТВЕННЫЙ СЕРВИС который смог выполнить задачу, которую я ему поставил. Я в шоке, за что я отдал деньги всем остальным. Типа, это мусорка видеогенераторов не улучшилась от начала лета вообще блядь, а вот эти ребята смогли ПОНЯТЬ промт, а потом его реализовать на реально качественном уровне (4 секунды , 1080р)
Крайне жаль, что у них нельзя продлить видео, но я теперь за ними плотно слежу
(люма с горем пополам переходы между кадрами вытягивает, остальные умеют генерить только шаблонные лица, стандартные кадры и никак вообще не могут потянуть рабочие задачи, хотя, мне кажется , детского уровня)
Моя задача сегодня была: img2vid
Промт: The camera starts with a medium close-up on a 35mm lens, centered on a cyber-samurai sitting at a desk in a studio. As the camera slowly zooms out, the outer digital world around the studio unfolds, revealing dynamic streams of code and low, flickering holographic symbols and icons floating in space. The atmosphere is a mix of mystic and digitally holographic, with a low, ambient glow casting flickering shadows across the scene. The style emphasizes a digitally limitless world, blending mysticism with futuristic holographics to illustrate endless possibilities.
получился консистентный отлёт камеры с консистентной студией и персонажем (персонаж вообще супер целым остался) с появлением голограмм , циферок и иконок в воздухе пока камера отъезжает
Короче, а теперь я пошёл прикалываться, а не решать конкретную задачу к этим видеогенераторам — работает как золото.
Хочешь видео с хренового джипега телеграмма жены? Держи, охренное видео
Хочешь с циферок на чёрном фоне сделаю моушн дизайн жирный по параллаксу? Держи
Хочешь дыму въебу? (потому что за персонажем которого я кидаю немножко дыма есть) — держи, дыма у меня мноооого
А с ранвей работается плохо. Люма больше радует даже, а на Vidu, походу, я за 10 баксов получу результата больше чем за всех остальных (блять, а там где-то 160 было потрачено)
Но vidu будет уже конкретнее к ночи понятно. Пока что он и ротоскопит, и накидывает графики, и камерой умеет ездить. Но, правда, толк из него есть только в 1080р
@cgevent
Сергей много писал про Adobe и про их систему.
Не буду дублровать, рекомендую посмотреть этот тред прямо там.
А вот история про создание видео из аудио - топ.
Ну и «молчаливые» видеогенераторы тоже уже нужно разговорить.
Небольшой дайджест за ноябрь
Открытие научного центра "AI для науки" Сбером
Сбербанк запустил центр "AI для науки", направленный на разработку платформ ИИ для исследований в химии, физике и биологии. Центр планирует тесное сотрудничество с ведущими научными организациями и университетами России.
Федеральная торговая комиссия США начала расследование в отношении Microsoft, изучая её деятельность в области кибербезопасности и продуктов ИИ.
Согласно исследованию Стэнфордского университета, США и Китай занимают ведущие позиции по развитию инфраструктуры и количеству научных исследований в области ИИ. Однако в этих странах отмечается недостаточное законодательное регулирование данной сферы.
США активизируют создание механизма добровольного тестирования передовых моделей ИИ. Институт безопасности ИИ (AISI) получил задачу наладить этот процесс, что подчёркивает стремление страны укрепить лидерство в области ИИ.
В ноябре OpenAI приобрела домен Chat.com, направляя его на основной сайт ChatGPT. Кроме того, соучредитель Грег Брокман вернулся в компанию после трёхмесячного отпуска, чтобы работать над ключевыми техническими задачами.
Исследование показало, что поэзия, сгенерированная ИИ, может быть неотличима от человеческой и даже получать более высокие оценки.
Похоже Minimax превращается в этакий генеративный Хаб.
Мы привыкли, что это прежде всего очень крутой видео-генератор.
Но в закромах у этого стартапа, во-первых, очень много денег, а во-вторых, есть очень много параллельных решений, о которых я лично и не догадывался.
Сейчас они все это упаковали в единый сайт, и, самое главное, сделали API ко всему хозяйству.
Кроме собственно Минимакса у них, оказывается есть:
Генератор Музыки Music-01!
https://www.minimaxi.com/en/news/music-01
Не Суно, конечно, но попытка защитана.
TTS Speech-01 - генератор голоса из текста:
https://www.minimaxi.com/en/news/speech-01
С эмоциональным, как пишут, интеллектом.
Speech-01 can handle up to 10 million characters in a single output!
Своя LLM - ABAB. Версия 7 в бете, а в 6.5 был триллион параметров и 200к контекст.
https://www.minimaxi.com/en/news/abab7-preview-release
https://www.minimaxi.com/en/news/abab65-series
Более того, у них уже есть упакованные продукты:
свой chatGPT:
https://www.hailuo.ai/
Я проверил, прекрасно пишет промпты для картинок.
https://www.hailuo.ai/?type=chat&chatID=317440964656717828
Внимание, у них свой ИИ-дэйтинг!
https://www.talkie-ai.com/
Looking for romance? (тут многие стартапы занервничали)
А еще у них есть Talkie Advanced Creation Center платформа для создания ИИ-ботов.
"Здесь вы можете не только управлять и создавать свои собственные интеллектуальные Talkies, но и выбирать различные модели ответов, настраивать и тестировать эффекты разговора ваших интеллектуальных агентов в реальном времени. В то же время, центр создания также предоставит различные плагины, такие как рисование, пение и т. д., чтобы поддержать более богатое и разнообразное создание интеллектуальных персонажей."
В общем Minimax - это не только ценный Video Gen, но и целый монстр, со своим выводком продуктов.
Для китайского рынка в первую очередь.
Весь фарш тут:
https://www.minimaxi.com/en
@cgevent
Совсем скоро грядет гипернадзор.
А не эти вот ваши трекеры часов, поверженных за компьютером.
С одной стороны прекрасно, с другой стороны вызовет сильное психологическое напряжение.
А так, век тотального контроля уже наступил.
Территории внимания осваиваются все более активно.
Если вам кажется, что за вами не следят, то…
Если и делать нейрорекламу Кока Колы, то только такую.
Согласитесь, смотрится куда круче нейрорекламы от самой Coca Cola.
И тут новенькое для меня, давно ждал такой функции:
Добавляешь данные о своем продукте или проекте и это лежит в базе знаний вашего диалога с клауди.
Для бизнеса - это просто шикарно - можно получить аналитику вашего продукта, отзыва клиентов или сделать комбинированную аналитику по всей базе загруженных файлов.
Типа:
Почему у меня низкие показатели конверсии?
Или, посмотри на мои документы по проекту и составь недостающие для презентации инвестору.
И еще немного вестей от Sora появилось.
Крутая работа с лицом. Не такой пластиковое и весьма консистентное.
Но видно, что это мелкая нарезка удачных кадров.
А так, конечно, круто.
Продавайте свои камеры 😉
💡 R1-Lite: бесплатный конкурент o1, готовый к релизу в опенсорс
Китайская команда DeepSeek, даже с ограниченными ресурсами, снова удивляет индустрию, выпуская модели мирового уровня.
Их новая разработка — R1-Lite — уже близка по показателям к o1-preview и даже превосходит её в некоторых задачах. Модель способна обрабатывать тысячи токенов одновременно, и чем больше их число, тем выше качество результата.
Что умеет R1-Lite
По бенчмаркам модель показывает лучшие результаты в кодинге и математике по сравнению с o1-preview, но в остальных задачах немного уступает. Например:
• Elo на Codeforces у o1-preview — 1258, у o1-mini и полноценной o1 — 1650 и 1673 соответственно.
• R1-Lite немного отстаёт в личных тестах, но всё ещё показывает отличные результаты для своей категории.
Ключевое преимущество — открытый доступ к размышлениям модели без ограничений, что отличает её от o1.
Скоро обещают опенсорс-релиз.
🧪 Почему Lite?
DeepSeek сейчас тестирует методы настройки на маленькой модели, прежде чем запускать полноценную версию. Хотя Lite-вариант основан на DeepSeek V2 Lite, её можно будет запускать даже на простых устройствах. Полноценный R1 обещает быть намного умнее и производительнее.
Попробовать R1-Lite можно уже сейчас:
• Включите функцию «Deep Think» на сайте.
• Дают 50 бесплатных сообщений в день!
Ссылка для теста.
Подсмотрел тут.
Так, потерпите, меня пробило на грибы и Runway.
Я щас доберусь до видеогенератров, но вот вам еще один очень классный пример, похожий на предыдущий о том, как вытаскивать 3Д мир из любой картинки, уже не имея никакой болванки в блендоре.
Берете в Runway Image2Video.
Просто используете новые управлялки из Runway, чтобы сделать видео облетов "внутри" картинки.
Используете эти видео чтобы собрать трехмерную сцену из Гауссианов в Unity Gaussian BOX Splatting.
А дальше вы уже в 3Д и просто светите сцену с помощью Custom URP Lit 6 ways Shader.
Еще раз - на входе картинка (хоть Флюкс, хоть древний Мидж) - на выходе вы бродите в Юнити по этой картинке внутри!
Шел 2024 год. Люди массово переселялись в картинки.
Сорс.
@cgevent
Claude в реальном времени смотрит, как идет строительство, и отмечает косяки.Хозяйке прорабу на заметку
@ppprompt
@LumiStellaBot
А тут можете поразвлекаться с нашим ИИ тарологом (пока что фри)
Я уже показывал арты, которые разрабатывал специального для этого приложения.
Ну и ИИ настроили хорошо, прямо самим приятно пользоваться.
Напишите нравится / нет, очень буду рад обратной связи.
Больше крипты в ИИ!
Или наоборот…
NEAR (крупный криптопроект) представлил ИИ -ассистента на крупной конференции Redacted в Бангкоке и рассказал о плане по созданию крупнейшей в мире модели искусственного интеллекта с открытым исходным кодом.
Были продемонстрированы возможности ИИ-помощника:
Был создан веб-сайт и логотип для нового мемкоина Frog, а затем мгновенно запущен на ресурсе Pump.fun от Near.
Объясняю конкретнее:
Криптопроекты осваивают инвесторские деньги и модная тема ИИ для этого как никогда кстати. Тут плюсы для всех - рынок ИИ активно снабжается средствами, а проекты имеют возможность реализовывать свои амбиции.
Но по большому счету: хайп хайповый - суть в этом.