3067
@Futuris - канал о технологиях, будущем и не только. Contact @antonod
NVIDIA и Microsoft представили новую платформу для агентных Windows-ПК: в центре анонса — NVIDIA RTX Spark, компактный AI-суперчип с производительностью до 1 петафлопа и до 128 ГБ unified memory. Это не просто “ещё один Copilot-ноутбук”, а попытка сделать ПК, где локальные AI-агенты смогут работать с приложениями, файлами и задачами прямо на устройстве.
Идея в том, что Windows постепенно превращается в среду для персональных AI-агентов: пользователь ставит задачу, а агент под контролем системы может сам открывать нужные инструменты, анализировать данные и выполнять действия. NVIDIA со своей стороны даёт железо и AI-стек RTX/CUDA, Microsoft — интеграцию в Windows и механизмы безопасности. По сути, это заявка на новую волну AI-ПК: меньше зависимости от облака, больше локальной работы моделей и агентов.
Ждать первые модели стоит осенью 2026; самые заметные — Surface Laptop Ultra, Dell XPS 16, ASUS ProArt P16 и HP OmniBook X 14. Если софт и Windows on Arm не подведут, это может стать первой серьёзной попыткой сделать “AI MacBook Pro на Windows”; если подведут — останется дорогой нишевой платформой для разработчиков и энтузиастов💡
https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark
Тибо обещает завтра ресетнуть лимиты Codex в честь 5 млн пользователей, сегодня работаем только в /fast режиме 😄
Читать полностью…
NVIDIA и Windows синхронно тизерят “новую эру ПК”: оба официальных аккаунта запостили одну и ту же фразу — “A new era of PC” — и координаты 25.0528, 121.5990. Это Тайбэй, где 1 июня пройдёт keynote Дженсена Хуанга на NVIDIA GTC Taipei / Computex. В сети ждут, что NVIDIA может показать новую платформу для Windows-ноутбуков — ARM-чипы N1/N1X с графикой NVIDIA и AI-ускорением, что-то вроде попытки сделать “Apple Silicon для Windows”🍿
Читать полностью…
Тут это, NASA показала план Moon Base и новое видео лунного ровера Lunar Terrain Vehicle — транспорта, на котором астронавты Artemis будут ездить (в том числе автономно) по Луне. Ровер должны доставить к поверхности в районе 2028 года / Artemis IV, а база у южного полюса будет разворачиваться поэтапно: сначала роботы, дроны и логистика, потом уже постоянное присутствие людей👾
Читать полностью…
ещё пару вариантов как я развлекаюсь с agi-image2😑:
промпт 1:
Создай черно-белую страницу “Анатомические записки экспериментов по скрещиванию” в стиле старых научных скетчей на бумаге. Каждый раз случайно создавай новый гибрид: насекомое + животное, животное + животное. Покажи большой основной скетч существа, маленького человека рядом для масштаба и несколько детальных анатомических зарисовок отдельных частей тела — ноги, броня, голова, рог, жвалы, хвост, крылья. Стиль: карандаш, тушь, штриховка, исследовательские подписи, схемы, бумажный фон. Гибрид должен ясно сочетать признаки обоих источников и каждый раз быть уникальным.
Покажи новую технологию будущего в суперреалистичном стиле. Каждый раз выбирай разную технологию и не повторяй прошлые идеи. Изображение должно быть масштабным, очень детализированным и правдоподобным. Покажи технологию целиком и добавь короткие понятные подписи к ключевым элементам конструкции, с тонкими линиями-указателями от подписи к детали. Стиль — футуристичный, инженерный, кинематографичный, реалистичный.Читать полностью…
Очередной codex limit reset к выходным, я начинаю привыкать ☺️
Читать полностью…
Какие красивые были бенчмарки у 3.5 flash, но такого даунгрейда никто не ожидал.. думаю, что даже pro версия не вытянет❌
Ещё раз о том почему больше нельзя верить этим графикам
Тем временем нашёл новый AI-gem💎
Sapient Intelligence — молодой AI-стартап, который идёт против тренда индустрии “чем больше модель, тем лучше”. Вместо триллионов токенов и гигантских дата-центров они продвигают HRM - Hierarchical Reasoning Model: архитектуру, где модель пытается “думать” во внутреннем латентном пространстве, а не просто предсказывать следующий токен. Сейчас они открыли HRM-Text-1B: веса, код обучения и data pipeline. Это маленькая 1B-модель, обученная всего на 40B токенов, но Sapient заявляет сильные результаты на reasoning-бенчмарках вроде MATH и DROP: в их сравнении HRM-Text обходит Llama 3.2 3B, Gemma 3 4B, Qwen 3.5 2B и OLMo 3 7B на ряде задач, а по MATH/DROP даже выглядит сильнее GPT-3.5. Важно: это не готовый чат-бот и не “AGI” (пока что), а исследовательская базовая модель; цифры пока self-reported, поэтому ждём независимых тестов, но именно такие идеи могут двигать всю индустрию вперёд🕺
Х - https://x.com/Sapient_Int/status/2056510383935172798
GitHub: sapientinc/HRM-Text
Hugging Face: sapientinc/HRM-Text-1B
определённо в список отслеживаемых проектов
Сегодня в 20:00 МСК начинается Google I/O - ждём релизов 🍿 (и возможно не только от гугла)
Google I/O '26 Keynote - YouTube
Ничего необычного, просто третий день стрима робота Helix-02, который выполняет монотонную работу за которую не получит зарплату 🫂
https://www.youtube.com/live/luU57hMhkak?si=l0BdCcr-Ws3VzqrW
раз уж заговорил про игры.. резко захотелось поиграть в forza horizon 6 (выходит 19 мая) 🏁
Читать полностью…
OpenAI объявили, что Codex теперь доступен в мобильном приложении ChatGPT в preview-режиме: можно с телефона следить за задачами, которые Codex выполняет на ноутбуке, devbox или удалённой машине, отвечать на вопросы, подтверждать команды, смотреть вывод терминала, скриншоты, diff’ы и результаты тестов. То есть Codex становится не только CLI/desktop-инструментом, а рабочим агентом, которым можно управлять “на ходу”. Также OpenAI отдельно отметила Remote SSH, Hooks и enterprise-возможности вроде programmatic access tokens и HIPAA-совместимого использования в Enterprise. Доступ разворачивается на iOS и Android для всех планов, включая Free и Go; для Windows-подключения телефона поддержка появится позже.
https://openai.com/index/work-with-codex-from-anywhere/
Всегда интересно смотреть на новые AI-изобретения не как на “ещё один чатик”, а как на попытку переосмыслить старые интерфейсы: Google DeepMind показали умный курсор для Gemini, где мышка не просто двигает стрелку, а понимает, на что ты указываешь на экране. Навёл на таблицу и попросил сделать график, выделил рецепт и сказал “удвой ингредиенты”, ткнул в кусок текста или код и сказал “исправь это” - без длинных промптов и копипаста между окнами. Если это доедет до Googlebook/Magic Pointer, получится любопытный сдвиг: AI будет не отдельным приложением, а слоем поверх экрана, где достаточно показать пальцем и коротко сказать, что нужно сделать.
Идея норм, я бы попробовал такой ИИ-экспириенс 🍿
Больше примеров в статье: Shaping the future of AI interaction by reimagining the mouse pointer — Google DeepMind
P.S.
Кстати, Google IO уже в следующий вторник (19 мая), ходят слухи о новых моделях gemini 3.2 в том числе омни, но мало ли будут ещё сюрпризы🌚
OpenAI выкатили в API новую линейку голосовых моделей:
GPT-Realtime-2 — самый умный voice-agent с рассуждением уровня GPT-5, который может вести живой разговор, понимать перебивания, думать по ходу диалога и вызывать инструменты;
GPT-Realtime-Translate — потоковый перевод речи между десятками языков;
GPT-Realtime-Whisper — расшифровка речи в реальном времени для субтитров и заметок.
Это пока прежде всего для разработчиков; обновления голосового режима в обычном ChatGPT обещают позже.
главное что нас ждёт: голосовые AI-агенты, которые слушают, рассуждают, перебивают/подхватывают разговор, вызывают функции и отвечают голосом
Джарвис, загружай
Синхронные переводчики ещё нужны?
MiniMax выпустили M3 — новую модель для кодинга и агентных задач с контекстом до 1 млн токенов и нативной мультимодальностью. Главная заявка: это должен быть open-weight конкурент закрытым coding-моделям, но важная деталь — веса и полный техрепорт пока не выложены, их обещают открыть в ближайшее время. Уже сейчас M3 доступна через API, MiniMax Code, OpenRouter и некоторые агентные инструменты; на OpenRouter на первую неделю включили 50% скидку. По бенчмаркам MiniMax заявляет 59% на SWE-Bench Pro, 66% на Terminal Bench 2.1 и 83.5 на BrowseComp — звучит сильно, но как обычно с релизными бенчмарками, ждём независимых тестов после публикации весов🧐
Читать полностью…
Опа, Computer Use теперь работает на Windows, то есть Codex может не только читать файлы и запускать команды, а ещё видеть экран, кликать, печатать и управлять обычными Windows-приложениями.
Вторая часть новости: Codex в мобильном ChatGPT теперь умеет подключаться к Windows-машине. То есть можно запустить задачу на ПК, уйти с телефона, смотреть прогресс, отвечать Codex, направлять задачу, пока работа продолжается на Windows.
Даже гоблина в пейнте нарисует 😑 (не удивлюсь, если так следующую фронтир модель назовут)
Anthropic выпустили Claude Opus 4.8 - с упором на агентные задачи, кодинг и более честную самооценку результата. Главные апдейты: модель доступна уже сегодня по той же цене, в Claude появился выбор “усилия” ответа, Claude Code получил dynamic workflows для больших задач с сотнями параллельных сабагентов, а fast mode для Opus 4.8 стал в 3 раза дешевле прежнего. По словам Anthropic, новая версия заметно лучше работает в долгих coding/agentic-сессиях, реже делает неподтверждённые выводы и примерно в 4 раза реже пропускает собственные ошибки в коде без комментария. Ещё важная деталь: Anthropic прямо пишет, что Mythos-class модели могут стать доступны всем клиентам “в ближайшие недели”, когда доведут cyber-safeguards.
Anthropic отдельно подчёркивает честность модели. Opus 4.8 чаще признаёт неопределённость и замечает проблемы в собственных ответах. Это звучит скучно, но для реальной работы это критично. Нам не нужен ИИ, который красиво фантазирует. Нам нужен ИИ, который вовремя скажет: “здесь я не уверен, надо проверить”.
🥳
тут папа Лев XIV позвал Anthropic в Ватикан обсудить, как разоружить ИИ.
Где-то в этот момент Warhammer 40k перестал быть сатирой и стал дорожной картой: священные манускрипты, машинный дух, Big Tech в роли тёмных механикумов, а Claude, видимо, ждёт одобрения от Омниссии.
Осталось понять главное: это энциклика или первый патч к Империуму Человечества?
Интересная опция появилась в Codex... только пока включить не могу🌚
Читать полностью…
Anthropic дала первый апдейт по Project Glasswing🧬 — программе, где Claude Mythos Preview ищет уязвимости в критически важном ПО. Масштаб уже серьёзный: вместе с примерно 50 партнёрами они нашли более 10 000 high/critical уязвимостей в системно важном софте. Отдельно Anthropic просканировала более 1 000 open-source проектов и нашла 23 019 потенциальных уязвимостей, из них 6 202 оценены как high/critical.
Интересные кейсы:
Cloudflare нашла около 2 000 багов, из них 400 high/critical. По оценке команды Cloudflare, false positive rate у Mythos Preview оказался лучше, чем у человеческих тестировщиков.
Mozilla с помощью Mythos Preview нашла и исправила 271 уязвимость в Firefox 150 — более чем в 10 раз больше, чем находили в Firefox 148 с Claude Opus 4.6.
UK AI Security Institute сообщил, что Mythos Preview стала первой моделью, которая прошла обе их cyber ranges end-to-end — то есть симуляции многошаговых кибератак.
В одном из банков-партнёров модель помогла обнаружить и предотвратить мошеннический перевод на $1.5 млн после компрометации email клиента и spoof-звонков.
Ещё один сильный пример — wolfSSL, криптобиблиотека, используемая миллиардами устройств. Mythos Preview нашёл уязвимость, позволяющую подделывать сертификаты: например, сделать фейковый сайт банка или почтового сервиса, который выглядел бы легитимным. Уязвимость уже получила CVE-2026-5194.
AI в кибербезопасности перешёл в новую фазу. Раньше узким местом был поиск уязвимостей. Теперь AI находит их так быстро, что слабым звеном стали люди👏 и процессы: нужно проверить находку, безопасно раскрыть её разработчикам, написать патч и дождаться обновлений у пользователей.
Anthropic пока не выпускает Mythos-class модели публично, потому что такие модели могут усилить не только защитников, но и атакующих. Но направление понятно: в будущем AI будет массово сканировать код ещё до релиза, помогать писать патчи и укреплять open-source. Если индустрия справится с потоком найденных багов, софт может стать намного безопаснее. Если нет — нас ждёт период, когда уязвимости будут находиться быстрее, чем закрываться.
Для сравнения: весь публичный CVE-рынок в 2025 дал около 48 185 CVE, из них один CVE data review насчитал 3 984 critical и 15 003 high, то есть примерно 18 987 high/critical за весь год по всему миру. Если цифры Anthropic подтвердятся, то их один проект за короткий период нашёл объём, сопоставимый с заметной долей годового мирового потока серьёзных CVE. Но повторю: CVE — это уже публично зарегистрированные уязвимости, а Glasswing — ещё этап поиска, проверки и disclosure.
Project Glasswing: An initial update \ Anthropic
Это буквально Big Brother Is Watching You 🫵
P.S.
А мы сидим и ждём пока нам дадут в аренду хотя бы 1% от этой мощи🕺
Принёс тренд гитхаба для тех кто вайбкодит крупные проекты с агентами - CodeGraph (8.8к ⭐️ за пару недель). Это локальная “карта проекта” для AI-агентов: он заранее индексирует репозиторий, строит граф функций, классов, вызовов и зависимостей, а потом агенту не нужно каждый раз вслепую бегать по файлам через grep/read. Главная польза — экономия токенов и времени на разведке кода: меньше лишнего чтения файлов, меньше tool calls, быстрее понимание структуры проекта. По бенчмаркам автора, на крупных репозиториях CodeGraph даёт в среднем до 92% меньше tool calls и до 71% быстрее exploration. В X уже есть реальные проверки: на Hermes repo с 3 479 файлами индекс построился за 3 минуты, а поиск символов занимал около 0.15 сек. Для маленьких проектов почти не нужно, а вот когда файлов сотни или тысячи - может ощутимо экономить токены, время и нервы. Работает локально, open-source, ставится через npm (уже ставлю себе, а то мой агент уже вторую неделю лимиты codex жрёт без перерыва на обед 🧃)
colbymchenry/codegraph: Pre-indexed code knowledge graph for Claude Code, Codex, Cursor, and OpenCode — fewer tokens, fewer tool calls, 100% local
Смотреть презентации Google I/O становится всё сложнее: фактически речь идёт об «AI везде»: не один отдельный релиз, а попытка Google впихнуть Gemini во всю экосистему (и нам всё это переварить). 🍎 Собрал тезисно, что зарелизили:
Gemini 3.5 Flash — новый быстрый «рабочий» Gemini: быстрее, дешевле, уже катится в Gemini app / API / AI Mode. На уровне с фронтир моделями но в 4 раза быстрее (Pro обещают в следующем месяце - но там и gpt 5.6 и новый клод подоспеют).
Gemini Omni Flash — новая мультимодальная модель для генерации/редактирования видео из текста, картинок, аудио и видео; Omni Pro обещают позже.
Gemini Spark — 24/7 персональный AI-агент: фоновые задачи, recurring tasks, работа через Google-продукты; тестерам на этой неделе, AI Ultra в США на следующей.
Antigravity 2.0 — апдейт агентной dev-платформы Google: новые agent-системы, интеграции, CLI, ускорение на Gemini 3.5 Flash.
Google AI Ultra — новый тариф за $100/мес, старший Ultra снижен с $250 до $200/мес.
Search AI upgrade — поиск становится более «agentic»: длинные запросы, расширяющаяся строка поиска, задачи, которые могут выполняться 24/7, например shopping/news.
В целом Google I/O оставляет ощущение, что компания распылилась - релизов много, но единого вау-момента меньше, чем ожидалось. С другой стороны, это понятно: Google — огромная экосистема, ей сложнее быть такой же быстрой и мобильной, как отдельным AI-лабораториям вроде OpenAI или Anthropic. Они двигают не один продукт, а целую инфраструктуру для миллиардов пользователей. Посмотрим, сможет ли Google собрать всё это в понятный и сильный пользовательский опыт.
Короче, остаюсь на chatgpt pro и иногда что-нибудь гуглю в новом поиске 😏
Вы, наверное, уже заметили, что админ “немного” фанат фэнтези и RPG, особенно во вселенной DnD🪄 как-то забыл про такие сессии в ChatGPT после первых попыток с Canvas: тогда всё работало криво, и нормальной партии не получалось. Так вот.. я тут уже вторую неделю продолжаю одну и ту же dnd-зарубу, причём это уже третий отдельный чат, а игра всё ещё держится цельно. Есть полноценный лист персонажа, спутники, события, инвентарь, история мира и последствия прошлых решений. Модель помнит контекст между чатами, конспектирует важные события, учитывает спутников и использует прошлые эпизоды в новых сценах.
Броски и расчёты gpt 5.5 делает через код, свои правила игры использует как источник данных, а сам процесс ощущается не как “чатик", а как вполне живая DnD-сессия с мастером🎁
вот ссылочка на актуальный чат если кто повторить захочет https://chatgpt.com/canvas/shared/6a06cd063d988191864e219ef1afc8c9
Одним постом: Claude повысили недельные лимиты на 50% до 13 июля (5-часовые были увеличены на днях). У Mythos, похоже, появился серьезный внутренний апгрейд: новый checkpoint Claude Mythos Preview удвоил успех на 32-шаговом cyber range AISI — с 3/10 до 6/10, обогнав GPT-5.5
На этом тесте проверяетcя не “знает ли модель кибербезопасность”, а может ли она долго и автономно вести сложную многошаговую операцию, не развалившись по пути. Поэтому скачок с 3/10 до 6/10 важен: новый Mythos checkpoint стал не просто умнее в отдельных задачах, а заметно надежнее как автономный cyber-agent.
P.S.
ну и ещё ходят активные слухи про релиз GPT 5.6 и новой модели claude буквально в ближайшее время (возможно во время Google I/O)
___________
А ещё принёс вам апгрейд для агентов который за последние пару дней попал в тренды гитхаба:
agentmemory — это внешний слой долговременной памяти для AI-агентов: он сохраняет контекст сессий, решений и проектов, чтобы агент меньше “забывал” между запусками. Полезность высокая для долгих проектов и работы с несколькими агентами/IDE, но для одноразовых задач почти избыточен: это не делает модель умнее, а улучшает восстановление контекста.
кажется словил баг в codex-cli - даже когда закончились недельные лимиты при активном /goal (да у меня уже почти 2 дня накопилось) - то сессия не заканчивается 🌚
Уже пару часов как кодекс пашет с 0% недельного лимита и 5-и часовой лимит вообще не меняется😐
или это очень хорошая политика компании, просто не буду вырубать ноут)
bro is cooking 👨🍳
P.S.
Важно, чтобы в codex был включен Yolo - режим кодекс (он тогда не будет разрешений на действия спрашивать)
codex --yoloЧитать полностью…
Ну всё, Codex теперь может подключиться к вашим вкладкам как агенты OpenClaw только без танцев с бубном - через своё расширение - открывать отдельные вкладки под задачи и выполнять рутинные браузерные действия в фоне, не забирая основной браузер👍
Доступно на Windows и IOS
вот для винды расширение Codex - Интернет-магазин Chrome
чтобы установить идёте в кодекс в плагины - там выбираете chrome 👌
Прикольное: Google DeepMind вложилась в создателей EVE Online: студия CCP Games стала независимой, переименовалась в Fenris Creations, а DeepMind получила миноритарную долю. На первый взгляд это просто игровая сделка, но на деле EVE может стать огромным полигоном для тренировки ИИ-агентов.
Почему это важно: EVE Online - не обычная MMO, а живая песочница с экономикой, войнами, дипломатией, альянсами, обманом и долгосрочным планированием. Для DeepMind это почти идеальная среда, чтобы тестировать ИИ, который учится действовать не в простых задачах, а в сложном социальном мире. Пока речь идет об офлайн-версии игры, не о вмешательстве в основной сервер.
Раньше ИИ учили обыгрывать чемпионов в го, теперь его будут учить выживать среди корпораций, войн и космических аферистов. Отличный план, что может пойти не так?😊