3066
@Futuris - канал о технологиях, будущем и не только. Contact @antonod
Теперь повторил ретро-эксперимент c Героями 3 в Sora 2 (за лесную нацию🧌🧙♂️)
Специально пытался сохранить похожесть персонажей (делал картинки в нано банана и скармливал соре), а не создавать просто по описанию.
Когда нибудь я погружусь в них в сгенерированном мире в VR и буду ностальгировать по полной🌚
Если что, GPT-5 с размышляющим режимом подтверждает👌
Читать полностью…
OpenAI и Broadcom объявили о многолетнем стратегическом сотрудничестве, в рамках которого OpenAI создаст собственные ИИ-чипы и ускорители для масштабирования вычислительных мощностей будущих моделей. Broadcom станет ключевым производственным и инженерным партнером, обеспечивая интеграцию решений — от сетей Ethernet и PCIe до оптической инфраструктуры для дата-центров. Планируется развернуть до 10 ГВт стоечных систем с кастомными чипами OpenAI начиная со второй половины 2026 года. Как заявили Сэм Альтман и Хок Тан, это партнерство укрепит независимость OpenAI от сторонних GPU-поставщиков и ускорит разработку более мощного ИИ, оптимизированного «от кремния до модели».
https://openai.com/index/openai-and-broadcom-announce-strategic-collaboration/
Пока со дня на день ждём Gemini 3 тут DeepMind анонсировал CodeMender — ИИ-агента для автоматического обеспечения безопасности кода, который анализирует программные базы, выявляет уязвимости, создаёт и применяет «патчи», а также переписывает небезопасные участки, чтобы исключить целые классы ошибок. Хотя проект пока находится на исследовательской стадии, он уже предложил (и внедрил) 72 исправления в открытых проектах за несколько месяцев и обрабатывал свыше 4,5 млн строк кода.
https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/?utm_source=x&utm_medium=social&utm_campaign=codemender
P.S.
Про Gemini 3 появились уже сливы, что контекст будет 10 млн токенов и будет возможность обращаться к сторонним тулзам, exсited!🌚✨
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
Вот так выглядят генерации Sora 2 (со звуком)
https://fixupx.com/OpenAI/status/1973055265084690780
Стрим через 50 минут
Интересное сравнение версий Claude, которые пытаются воссоздать полностью рабочий чат claude.ai👌
Когда уже AGI? 🤔
Suno V5 + Suno Studio — RIP Mozart AI
Недавно я писал про Mozart AI, которые пытались сделать AI DAW (Digital Audio Workstation) для музыкантов. Но их продукт, как многие заметили в комментариях, всё ещё сырой. И вот пришёл гигант — Suno (по моему мнению, лучший, лучше чем Udio), выкатил свою новую SOTA-модель V5 и сразу же полноценную Studio-версию. И просто решил все проблемы.
По сути, это всё, что обещал Mozart AI, но уже реализованное и с новыми фичами. Главная из них — можно напеть мелодию, а затем превратить её в отдельную дорожку (stem), как на 10:25.
Что это даёт? Дикий контроль. Теперь продюсер, имея один только ноутбук, может получить реалистичную аудиозапись инструмента, а не MIDI-болванку. Причём со всеми нюансами, которые невозможно запрограммировать: реалистичной динамикой, звуком удара медиатора по струнам или шорохом пальцев гитариста по грифу, и всё это в «комнате» с её естественным эмбиенсом.
Профессионалы, конечно, не будут использовать Suno Studio как основную DAW, но как генератор стемов — это геймченджер.
Многие боятся, что генеративная музыка захламит чарты AI-слопом (треть новой музыки на стримингах уже сгенерирована). Но я думаю, что именно эта технология сделает музыку только лучше. Теперь вместо стерильных, запрограммированных в MIDI инструменталов можно будет генерить реалистичные аудиодорожки, что только поднимет общее качество продакшена.
V5 доступна пока только по подписке. Suno Studio — на тире Premier, но сейчас есть скидка: $15 в месяц на первые 3 месяца вместо $30.
@ai_newz
Роботы роботы роботы🤖
Google представила Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 — новые модели, которые выводят ИИ-агентов в физический мир. Gemini Robotics 1.5 — это модель «зрение-язык-действие», которая превращает визуальную информацию и инструкции в команды для робота, при этом «думая» перед действием и объясняя свой процесс. Gemini Robotics-ER 1.5 отвечает за планирование и логические решения, умеет вызывать цифровые инструменты и создавать пошаговые планы, достигая лучших результатов на тестах пространственного понимания. Вместе эти модели позволяют роботам выполнять сложные многошаговые задачи, учиться на разных типах устройств и действовать более прозрачно и безопасно. Gemini Robotics-ER 1.5 уже доступна разработчикам через Gemini API и AIStudio, а Gemini Robotics 1.5 предоставляется избранным партнёрам.
OpenAI + NVIDIA = ❤️
OpenAI и NVIDIA заключили партнёрство: NVIDIA инвестирует до 100 млрд долларов в развертывание не менее 10 гигаватт вычислительных мощностей для OpenAI🤯 Первые системы на базе платформы Vera Rubin заработают во второй половине 2026 года. Цель — создать инфраструктуру для обучения и запуска новых поколений ИИ и приблизить разработку искусственного общего интеллекта (AGI).
Если что 10 гигаватт сравнимо с 10 ядерными электростанциями⚡️🌚
В декабре в ChatGPT завезут эротику и другой NSFW контент (интересно, в Сору тоже? 🌚)
Ну и выпустят какую-то эмоцильную версию чата через пару недель🙈
Интересно, как будут проверять возраст, также как и все сайты с указанием даты или может по сечатке глаза? 👁
https://x.com/sama/status/1978129344598827128
Ничего необычного, просто автоматизированные доки в Китае🌚
Читать полностью…
У человека появилось настроение, человек захотел эпичного видео, человек сделал его, человек посмотрел его, ещё раз, человек доволен🗿
https://youtube.com/shorts/254u56C5gUc?si=dptWoUn95WdMeD45
P.S.
Музыку из Suno 5 взял
Чел прикрутил gpt5 к live data с рынка криптовалют и нейронка пыталась прогнозировать цену и торговать. Делать технический анализ (да и вообще какой-то) на крипте дело неблагодарное, но как потенциал использования нейронок в трейдинге очень интересно 🤑
Читать полностью…
Ну вот вроде получилось что-то более менее консистентное (скринил последний фрейм и использовал для следующей генерации) - потом обрабатывал в отдельном редакторе🌚
Вот мой инвайт RXQT90 для первых четырёх счастливчиков кто успеет ввести✨
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
получил доступ и проверил свою любимую тему и офигел, если Близы не снимут продолжение, то я возьму эту миссию на себя🌚😈
Читать полностью…
Ещё парочку... даже как-то не по себе от того, что.. ну вы поняли, представим Sora3/Veo4 и дальше😅
Читать полностью…
OpenAI представила улучшенную модель для генерации видео Sora 2, которая создает более реалистичные видео с соблюдением физики и автоматическим добавлением синхронизированного звука. Также выпущено мобильное приложение Sora, где пользователи могут создавать и редактировать видео, в том числе с помощью функции «камео» для добавления своего цифрового образа в сцены. Пока приложение доступно только по приглашениям в США и Канаде.
Читать полностью…
OpenAI представила функцию Instant Checkout в ChatGPT — теперь пользователи в США могут покупать товары прямо в чате у продавцов Etsy, а вскоре и у более миллиона магазинов Shopify. Покупка совершается через новый открытый стандарт Agentic Commerce Protocol, созданный совместно со Stripe: он позволяет ИИ-агентам, людям и бизнесу безопасно оформлять заказы без изменения бэкенд-систем продавцов. Для покупателей процесс занимает несколько кликов, а продавцы сохраняют полный контроль над оплатами и клиентскими данными. Эта новинка открывает этап «агентной коммерции», где ChatGPT помогает не только выбирать товары, но и покупать их💰
Следующим шагом ждём появления нативной рекламы🌚
Вышла Claude Sonnet 4.5, которая, по словам компании, обеспечивает значительный прорыв в способности к программированию, рассуждению и математике. В числе нововведений — улучшенная работа с инструментами и памятью, возможность возвращаться к предыдущим состояниям (checkpoints), расширенные API-функции и SDK для построения агентов, а также повышения уровня безопасности и согласованности поведения модели. Модель уже доступна всем пользователям✨
https://www.anthropic.com/news/claude-sonnet-4-5
а ещё на этой неделе все ждут Gemini 3.0🌚
Kling 2.5 Turbo бросает вызов Veo 3
Вышла новая версия китайской модельки под скромным номером 2.5, что как бы намекает — это ещё не революция, и нам стоит ждать большего.
На деле же мы получаем физику и prompt understanding на уровне, очень близком к SOTA от гугл. Черипики, как всегда, топовые, но это не показатель — с этим справилась даже Luma на своей сомнительной Ray 3. Дополнительных данных нет — ни бенчмарков, ни даже официального блогпоста.
Пока вышла только Turbo-версия. Pro или Standard скорее всего существуют в недрах компании, но не факт что их релизнут. А если они и появятся, выигрыш в качестве не гарантирован — так же, как с Veo и Veo Fast, которые хоть и отличаются в стоимости в 5 раз, но на деле дистиллированная версия выдаёт почти неотличимый от полноценной Veo 3 результат.
Потестить уже сейчас можно на самом klingai.com, а также у независимых провайдеров вроде Fal, Freepik и Higgsfield. Последние, кстати, прикрутили удобный промпт-энхансер, который переводит подсказку в JSON. Там же сейчас можно крутить модельку безлимитно по подписке Creator и выше.
@ai_newz
Исторические события в виде компьютерных игр от Veo3, в какие нибудь я точно поиграл, а вообще изучать историю через игры, что может быть лучше👌
Читать полностью…