7 из 12 стрим OpenAI, через 5 минут тут:
https://www.youtube.com/live/FcB97h3vrzk?si=xjUjA8kQxsJLMglh
Но самая безумная фича пока что, это смешивание двух видео - она довольно сложная в контроле и будто ее специально добавили чтобы люди поигрались
Можно задать как одно видео влияет на другое, можно только стиль перенести, а можно поместить куски видео в другое видео
Тут я совместил два ролика, что уже постил в канал – привет свиборгам
А еще Sora умеет в video-to-video ремиксы с разной силой – влияние силы я выложил в этом твиттер-треде, но если коротко, то 4-5 силы ремикса это максимум что нужно современному мемологу или мемологине
Сама по себе фича шикарная – особенно если на старых гифках ее прогонять – можно как бы оставляя суть идеи, полностью менять графику сцен
P.S. в первом меме текст дописал сам, очень уж хорошо вышло
P.P.S. Мемы без компрессии телеграма
Норм реклама в США пошла:
Ремесленники (которые) не будут жаловаться на баланс между работой и личной жизнью
Эра сотрудников на базе ИИ уже наступила
Брухи ставят кожаные, не завидуйте!
Нет-нет, вы не поняли, он может прям взять вашу фотку, подумать над ней и дорисовать, например, ход в крестиках-ноликах 😏
(функция доступна только доверенным бета-тестерам, полноценный релиз для всех в начале следующего года. У меня вот нет доступа, это скриншот из твиттера)
Получил доступ к Google Vids:
проекту который сам собирает видео-презентации с озвучкой, видео и генерацией текста – приложил как выглядит созданный ролик и как создается такой ролик
Проект сделан в стиле Google Dock, но я пока не понял почему он называется Vids – видео подтягиваются с Shutterstock и в целом проект напоминает приятный Google Slides, а не видео в классическом понимании
Если добавят вертикальные видео, то замусорить тикток станет еще проще 👍
P.S. Лол, только сейчас заметил что он там несколько раз одни и те же фразы озвучил – в общем, пока сыровато
В общем, пока у меня вывод такой – пользоваться Sora можно только тиром за $200, потому что иначе можно потратить все $2000 пытаясь получить хорошие генерации
Такая же проблема с Gen3 у Runway, с Kling, а вот Minimax по ощущениям приятнее генерирует в img2vid задаче
Если будете видеть удачные ролики с генерациями Sora – напоминайте себе, что они созданы через муки перегенераций сотен кусков видео 😮
Это вот сделалось в самом долгом режиме Sora генерации 1080p – в общем, пока без понимания контекста в видео, хоть и получилось сильно похоже на Горько 3 ☕️
Читать полностью…Так, ну что, поехали – сайт ожил
На вход я подавал картинку с мемом и вот эти выкрутасы в стиле Netflix она уже сама придумала 😮
– Через VPN работает
– В презентации сказали:
«Это не способ создания фильма с одного клика, Sora это инструмент, она не заменяет человека» – тут согласен
– Максимальная длина видео ~20 секунд
– Лол, только с моим Pro тиром можно загружать картинки в которых есть люди в Sora, то есть за $20 в месяц этой фичи нет
– Семейное фото где я ребенок с родителями и братом она отказалась оживлять
3 из 12 стрим OpenAI, через 5 минут тут:
https://www.youtube.com/watch?v=2jKVx2vyZOY
(не буду вам рассказывать что в субботу тоже сидел ждал стрима и оказывается они не работают в выходные 🤡)
Что показали:
В ChatGPT теперь появились проекты – можно загрузить нужные к проекту документы, кастомные инструкции, ну или просто использовать проекты как папки для чатов
Наконец-то хаос в левой колонке можно организовать
Этой же фичей я пытаюсь выбить из Sora реставрацию старинных видео, пока не получается, но я продолжу; оригинал – первое видео на нашей планете
Читать полностью…Или вторая моя любимая фича Sora – она, как бы ее назвать, позволяет залупливать любое видео – то есть проигрывать любые ролики как непрерывные гифки
И оно работает со своими видео тоже
Что показали:
– Advanced Voice Mode теперь поддерживает видео-стрим, то есть можно показать аппу видео с камеры или пошарить экран (с телефона или компьютера) – можно делать вместе домашку, писать код, или готовить вместе, короче клевая штука, выходит сегодня и раскатают в течение недели на всех. Машину в гараже разбирать стало проще!
Интересно сможет ли она помочь с фитнесом и правильными техниками, например
– А еще в ChatGPT добавили Санту с которым можно пообщаться (кнопка снежинки), и у него клевый Санта-голос – доступно с сегодня
Модель для разборки | vol. 2
Снова четверг, поэтому новая подборка нейронных песен – напомню, мы пытаемся достать из латентного пространства самые странные, отбитые, не человеческие звуки или виды музыки из возможных, желательно чтобы кожаный не стал бы такое писать или делать.
В прошлый раз, вы проголосовали за "Neurofunk Acceleration" и "Temporal Loop Fusion," – очень быстрый и злой нейронный бит, поэтому новые стили были сделаны исходя из него – почти все песни стали злее и быстрее, а некоторые почти невозможно слушать ✝️
Первая подборка тут; голосуйте за треки, и исходя из топа, в следующий четверг, песни унаследуют их звучание
@denissexy
P.S. Лицензия у всех треков CC0, можете где хочется использовать если что-то понравится
На всякий случай напишу отдельно, так как это легко пропустить. Новая Gemini умеет генерировать изображения сама, без вызова внешних рисовалок. При этом свои же картинки она видит в контексте, и умеет копировать части изображения. Такое умеет и gpt-4o, но эту фишку OpenAI пока не выпустили — быть может, в оставшиеся 7 дней релизов успеют.
Это открывает доступ к новым сценариям, невозможным (или затруднительным) ранее. На скриншотах вы видите пример, как пользователь подсунул картинку из мема «рисуем сову», и попросил дорисовать все промежуточные шаги. Модель взяла часть исходной картинки за основу и сгенирировала несколько новых (по сути «поверх», но там сгенерирован каждый пиксель, нет команды «вот это оставляем, вот это меняем»).
Круто, что модель сама поняла, как декомпозировать рисунок, без дополнительных указаний, так ещё и шаги пронумеровала — 1.25, 1.5 😀
Другие сценарии применения (в том числе генерацию GIF-ок) можете посмотреть в оригинальном блогпосте про GPT-4o (+1 последняя картинка тут для затравки).
Источник картинок
Что показали:
Ничего интересного, интеграцию Mac, iOS, iPad на уровне ОС с ChatGPT 🤦♂️ мы это уже видели в iOS короче
Что показали:
🌹 Обновили ChatGTP Canvas:
https://chatgpt.com/?model=gpt-4o-canmore
Это что-то вроде умного Notion/Google Doc, где слева вносишь правки через чат, а документ/код всегда справа, и обновляется моделью или пользователем, а не переписывается с нуля:
– Режим Canvas теперь доступен всем
– Модель может оставлять комментарии к вашему тексту или коду, а не просто редактировать его
– Теперь Canvas работает с кастомными GPT’s (вот бы ими еще занимался кто-то в OpenAI)
– Canvas может исполнять Python код, например, когда нужна какая-та дата аналитика или скрипт не работает, его сразу можно отправить в ChatGPT
В общем, OpenAI опять ряд стартапов сегодня закрыла 😮
А вот в моей любимой теме путешествия во времени – перспективы есть, это Рим 1го года (исторически не точный, но все же)
Читать полностью…Мне вообще генеративный AI в последнее время все больше напоминает рулетку или MMORPG – хочешь хороший результат, будь готов его выбивать 😮
Читать полностью…Вот что показали:
Официально релизнули Sora – sora.com
Показали Sora Turbo – более маленькую модельку для быстрых генераций
По ссылке много примеров
Причем, Sora идет с разными встроенными тулами, и редактором видео/генераций как отдельный продукт
😮 Лимиты:
– 50/генераций в месяц с Plus акаунтом за $20/месяц
– Сколько угодно генераций с Pro аккаунтом за $200/месяц
Sora всё ближе! 🥳
На сайте OpenAI уже появилась страница со списком стран где будет доступна Sora. Сюрприза не случилось: модель недоступна в ЕС и Великобритании, из-за драконовских регуляций. Всем остальным странам, где есть ChatGPT, доступ дадут.
Судя по тому, как участились утечки (вроде вчерашней экранки), релиз не за горами, может быть даже сегодня вечером! Но, мне кажется, что желающим попробовать Sora стоит приготовить $200 на новый тир подписки - генерация даже пары секунд видео это очень дорогое удовольствие, а ведь Sora 2, судя по утечкам, сможет генерить аж целую минуту!
@ai_newz