Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
А вот и юзкейс из жизни: агент переименовывает слои из стандарта индустрии привычных нам layer5 в понятные имена в зависимости от их содержимого.
X.com
AI caring about such individuals by default with no need for any additional prompting was… somehow out of my bingo card for search engine evolution
Читать полностью…А еще в Genie 3 можно загрузить любую картину и «прогуляться по ней» в симуляции, как в интерактивной игре
Мне нравится думать, что к ~2030 мы сможем оживить все личные фотоархивы что у нас есть на устройствах, из фото или видео, очень хочется
В десктопной версии Gemini теперь можно делать целые книжки с картинками.
Гемини сама напишет историю, может взять ваши картинки на вход для стиля, и сделает не просто книжку, но и аудио версию к ней.
Мне это напоминает диафильмы на стероидах.
Достаточно написать в промпте "create storybook about .... как срать не снимая свитер"
Он сделает книжку, ее можно смотреть в Гемини, там же слушать или шарить ссылку.
Экспорта в пдф или MP4 не нашел.
Поглядите пример:
https://gemini.google.com/share/52a81c4683ea
Работает только в браузерной версии Гемини. В мобильном приложении пока нет.
Пришёл вечером домой, давайте дети сказку послушаем. Про свитер.
Поставил аудио версию, вывел картинки на телевизор, и ну спать (или новости писать в телегу)
@cgevent
Современные проблемы требуют современных решений
(Тем временем в консоли: undefined)
@derplearning
А вы знали, что в Veo-3 можно просто нарисовать на первом кадре визуальные инструкции: всякия стрелочки, подписи типа "сюда не ходи снег башка попадет". И Veo3 это пережует и поймет. Экономия на промптах. И никакого джайсона.
@cgevent
Мы родились слишком поздно, чтобы бороздить океаны, слишком рано, чтобы исследовать космос, но как раз вовремя, чтобы делать ии каверы на Меладзе.
Читать полностью…the budgets of the casting couch videos are getting out of hand
soon (tm)
paperswithcode.com поплохело или как еще привлечь аудиторию к ml пейперам
Читать полностью…На видео — результат работы лидаров, установленных на автомобилях Waymo.
Стало интересно: видит или чувствует ли кто-либо из живых существ эту психоделическую лазерную рейв-пати🤪
Waymo использует лидары (LiDAR — Light Detection and Ranging), которые работают на лазерном излучении в диапазоне около 900–1550 нм (вблизи инфракрасного).
Это невидимый спектр для человека, но некоторые животные способны его улавливать или, по крайней мере, быть чувствительными к нему.
В итоге, только некоторые виды змей могут чувствовать тепло от подобного излучения. Некоторые виды насекомых — пчёл, ос и рыб, ну и, конечно, некоторые виды летучих мышей, но почти никто не видит, по крайней мере в этом диапазоне.
Все эти ребята могут ловить сбои в навигации, но только при близком контакте. Так что сильно переживать не стоит о том, что к вам забредёт змея — по крайней мере, если опираться на текущие данные.
Хотя я как-то поймал летучую мышь в окно в Тае, когда на улице был сильный дождь — не просканила достаточно далеко, чтобы понять, что залетает ко мне в хату.
Finally, голошоп!
Агент через mcp плагин рулит фотошопом, what a time to be alive!
X.com
AI индустрия сделала одну вещь хорошо: обманула продактов и нагрузила их работой. Теперь они кодят вместо джунов, оплачивают подписки трех ИИ тулов, радуются и считают, что это они всех перехитрили.
Читать полностью…В преддверии выхода Gpt-5 копим крышки и сохраняем важную инфу (бензин из бензобака станет непригодным всего через 3 месяца, а в специальном хранилище протянет максимум года 3)
Читать полностью…Genie 3 — SOTA World Model от Google
World Model — это по сути нейронные игровые движки, позволяющие двигатся и взаимодействовать с миром.существующим исключительно в воображении нейросетки. Прошлое поколение — Genie 2, позволяло создать по текстовому промпту окружение, в котором можно было походить 10-20 секунд в 360p. В этом поколении разрешение уже 720p, а длится взаимодействие с ней может уже несколько минут.
Но делает особенной эту модель возможность хорошо помнить эти несколько минут симуляции, даже взаимодействия пользователя с миром. Одно из демонстрационных вдиео — как пользователь красит сцену, потом отходит и немного крутится по комнате, а краска на стене остаётся. А ведь меньше года назад в нейронном майнкрафте достаточно было просто отвернутся чтобы модель совсем забыла всё об окружающей среде.
Крайне сильно выросла и возможность симулировать живой мир — промпты позволяют сгенерировать не просто окружение, но и события в этом окружении. Такая эволюция позволяет уже запускать симуляцию для тренировки полноценных агентов для реального мира, которым можно тренировать выполнять разные задачи. Я, правда, очень смутно представляю как такое окружение сделать верифицируемым.
А вот игры на такой технологии представляются куда проще — ведь не просто так игровой гигант Tencent настолько сильно инвестирует в world models. Кстати, многие не знают что глава Google DeepMind, Демис Хассабис, начинал с игровой индустрии. До DeepMind он основал свою студию, которая выпустила несколько игр, например Evil Genius.
Блогпост
@ai_newz
Wan 2.2 почти смог в Икею.
1.5 часа на 4090 @ a14b t2v q8, 720p, 121frame, 20steps
Весы
@derplearning
Но кого мы обманываем. На самом деле наши берлоги выглядят вот так.
Промт в комментах.
В Осаке, Япония, нашли способ полезно применять дроны – как указатели в небе на мероприятиях ☕️
Читать полностью…How to turn your average high heels bimbo into a slav trad wife?
Читать полностью…