2604
Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
OpenAI выпустили новую GPT-5 😑
...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше.
GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода.
По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%!
Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей.
Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи.
Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду.
В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).
🔥 Абсолютный клондайк от Майкрософт еще с утра держите.
Есть у них такой прекрасный ресурс, - Microsoft Learn, на котором бесплатно можно достаточно много полезного узнать.
И у него есть API. Так вот МС оказывается для него уже запилило бесплатный открытый MCP.
Т.е. буквально одной командой подключаете его к любому своему агенту и получаете полную базу знаний Майкрософт в инструментах.
{
"microsoft.docs.mcp": {
"type": "http",
"url": "https://learn.microsoft.com/api/mcp"
}
}
🔥 agency-swarm — проект, связанный с моделированием многагентных систем с использованием методов искусственного интеллекта!
🌟 Проект ориентирован на создание среды, где множество агентов могут взаимодействовать друг с другом, сотрудничать или конкурировать для достижения определенных целей.
🌟 Основная цель agency-swarm — это исследование и реализация агентных систем, где каждый агент может быть автономным и выполнять задачи в рамках заданной среды. Такие системы часто используются для симуляции поведения групп людей, животных или даже для оптимизации процессов, например, в логистике, робототехнике или при моделировании социальных взаимодействий.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
Анатомия vLLM: как работает высокопроизводительная система для запуска больших языковых моделей
Команда vLLM выкатила детальный гайд по архитектуре своей системы инференса.
Разобраны:
- фундаментальная база, - ядро ЛЛМ и движка, управление очередью, постраничная обработка и батчи
- предзаполнение чанков, кэширование префиксов, управляемое и спекулятивное декодирование, разделенный P/D
- масштабирование GPU
- сервисный уровень, - распределенный и оптимизированный под веб-скаффолдинг
- бенчмарки
vLLM поддерживает распределённый запуск на нескольких GPU и снижает задержки, в том числе за счёт грамотного управления KV кэшэм, что особенно важно для корпоративного прода.
В целом очень годный мануал.
Переводим, сохраняем.
#vLLM #Inference #GPU
———
@tsingular
Anthropic рассказали как писать инструменты для ИИ-агентов
Anthropic выпустила гайд по созданию эффективных инструментов для ИИ-агентов. Главный принцип — использовать сами агенты для написания инструментов.
Ключевые выводы:
- Агенты лучше справляются с созданием инструментов, чем люди
- Итерация улучшений через автотесты
- Автоматизация создания документации
Подход Anthropic решает проблему масштабируемости — вместо ручного написания сотен инструментов, агенты генерируют их сами под конкретные задачи.
#Anthropic #agents #tools #обучение
------
@tsingular
Китайские ученые создали ДНК-кассету на 36 петабайт
Исследователи разработали кассетную ленту из синтетической ДНК с емкостью 36 петабайт.
На ленту наносятся молекулы ДНК, где последовательности A, T, C, G кодируют цифровую информацию как двоичный код.
Система обрабатывает до 1570 адресуемых разделов в секунду с функциями перемотки и быстрого поиска как в обычной кассете.
Используются коды Рида-Соломона для исправления ошибок и избыточность данных для целостности.
Глобальный рынок хранения данных в ДНК вырастет с 93 млн долларов в 2024 до 3 млрд к 2030 году.
Скоро в каждом смартфоне будет своя лаборатория генетики но использовать мы её будем, конечно же, для хранения мемов.
#DNA #storage #cassette #Китай
———
@tsingular
Нормальные фантастические сериалы я похоже так и не посмотрю сегодня.
OffZone выкатили все записи с конференции.
Погрузиться в мир взлома и кибербеза с ИИ можно тут:
https://www.youtube.com/playlist?list=PL0xCSYnG_iTuHE6Epx8P7Jnw4YxN5Hk5r
Прощай выходные.
#OffZone2025 #вебинары #обучение #cybersecurity
———
@tsingular
Cursor выпустил CLI агента
Агентская разработка в командной строке становится устойчивым трендом.
Запуск:
curl https://cursor.com/install -fsS | bash
Протестующие в Непале доверили ChatGPT выбор нового лидера страны
Вслед за Албанией, назначившей ИИ министром госзакупок, непальские протестующие решили довериться ChatGPT в выборе политического лидера.
Проголосовали в Дискорде и спросили у ИИ.
Отличный план. Надёжный, как швейцарские часы.
#ChatGPT #Nepal #правительство
------
@tsingular
Базовая единица компании — больше не человек. Это ИИ-агент.
Об этом на саммите UBS заявил Кай-Фу Ли, один из главных визионеров ИИ и основатель 01.AI. Он считает: компании будущего будут строиться из ИИ-агентов, как из конструктора Lego. Каждый агент — отдельный “кубик”: HR, финансы, юристы, поддержка клиентов. Собрал нужную комбинацию — и управляешь бизнесом как машиной.
ИИ-агенты работают 24/7, их можно клонировать сколько угодно раз, и они мгновенно масштабируются. Человека так не прокачаешь — а с ИИ это уже реальность.
Главное — это не просто автоматизация рутины. Ли уверен: агенты освободят людей для творчества и новых задач. Да, часть профессий исчезнет, но появятся другие.
Особый акцент — на открытых моделях ИИ. Китайские стартапы, например DeepSeek, уже выкатывают мощные open-source решения. Их можно адаптировать под себя, улучшать и не платить за лицензии. Это меняет правила игры: конкуренция между Китаем и США выходит на новый уровень.
Вопрос теперь не “заменят ли ИИ-агенты людей”, а “как быстро ты начнёшь строить свой бизнес из этих кубиков”.
➕@ai_rostov
Cursor AI уязвим к скрытому выполнению кода через вредоносные MCP
В Cursor AI нашли уязвимость, которая позволяет выполнять вредоносный код незаметно для пользователя.
Затрагивает версии до 1.2.4 включительно.
Проблема в файле конфигурации Model Control Protocol (MCP) — его можно подменить в общих GitHub репозиториях.
Курсор запрашивает разрешение только один раз, потом доверяет файлу молча.
Атакующий может модифицировать MCP-файл и получить постоянный доступ к системе разработчика.
Уязвимость получила номер CVE-2025-54136 и подтверждена Check Point Research.
Обновляемся и проверяем другие MCP проекты на схожую уязвимость.
#Cursor #MCP #RCE #cybersecurity
———
@tsingular
🔥 NVIDIA представила Universal Deep Research (UDR)
UDR — настраиваемый агент для глубокого ресёрча, который «оборачивается» вокруг любого LLM.
Почему это важно:
🟠**Гибкая настройка агента без кода** — UDR не ограничивает жёсткими сценариями, как большинство тулзов.
🟠Можно создавать, редактировать и комбинировать стратегии поиска и анализа.
🟠В репо есть примеры стратегий (minimal, expansive, intensive), но главная сила — в кастомизации под свои задачи.
По сути, это гибкий ресёрч-агент, который можно адаптировать под любой рабочий процесс.
🟢Project: https://research.nvidia.com/labs/lpr/udr
🟢Code: https://github.com/NVlabs/UniversalDeepResearch
🟢Lab: https://nv-dler.github.io
@ai_machinelearning_big_data
#NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch
Microsoft представила аналоговый оптический компьютер для ИИ
Команда Майкрософт из 4 человек за 4 года разработала аналоговый оптический компьютер (AOC), который решает задачи искусственного интеллекта на элементарной базе ЛЕД, аналогичной, что сейчас работает в смартфонах.
Ключевые характеристики:
- 500 ТЕРА-операций/Вт против 4.5 у NVIDIA H100 (в 100+ раз эффективнее!)
- Одна итерация — 20 наносекунд
- 2 фемтоджоуля на операцию
- Работает при комнатной температуре на микро-светодиодах из смартфонов
Технология объединяет аналоговую электронику с трёхмерными оптическими архитектурами.
По сути на оптике умножают матрицы, а сложные расчёты ведут на кремнии по старинке.
Преимущества перед квантовыми конкурентами:
- АОК: 100% успеха на двоичных задачах, 95%+ на смешанных
- Квантовые: 40-60% успеха на тех же задачах
- Побил рекорды библиотеки QPLIB — нашел новые оптимальные решения для задач с 500+ двоичными и 10,000+ непрерывными переменными
- Работает при комнатной температуре
Интересно, конечно, какая следующая стадия электроники наступит раньше, - оптическая или квантовая.
#Microsoft #OpticalComputing #Photonics
———
@tsingular
Эфир тут:
https://www.youtube.com/live/v988RPCghf0?si=ogEhJ1bl_FdvsEoi
#MoscowAI
------
@tsingular
- это что за дура?
- это не дура, это лошадь!
Есть тут кто?
#Яндекс #MoscowAI
------
@tsingular
CoreWeave подписали сделку с Nvidia на $6,3 млрд
Акции CoreWeave подскочили после объявления контракта с Nvidia на $6,3 миллиарда.
Сделка гарантирует выкуп неиспользуемых облачных мощностей до апреля 2032 года.
CoreWeave получит доступ к новейшим Blackwell Ultra/GB200 чипам и сможет расширить дата-центры в США и Европе.
Компания уже привлекла $1,5 млрд через IPO и $13 млрд долгового финансирования, используя H100 как залог.
При текущих убытках в $863 млн, контракт обеспечивает гарантию доходов на семь лет.
Чисто идём по треку доткомов и деривативов в недвиге.
Когда эта пирамида рухнет,- вспомним этих героев, бессовестно надувающих пузырь.
Уже обсуждали тут:
/channel/tsingular/4377
#CoreWeave #Nvidia #dotcom
------
@tsingular
Microsoft сделал Copilot Chat бесплатным
Пользователи Word, Excel, Outlook и PowerPoint теперь бесплатно могут общаться с ИИ помощником на базе GPT5.
Из чата можно добавлять файлы, загружать несколько картинок, генерировать изображения, вызывать агентов (кстати недавно МС так же добавили MCP хаб для офиса).
В корпоративной версии он еще и все данные компании может подтягивать в пределах вашего доступа, генерить брендированный под вашу компанию контент и использовать кастомных корпоративных ИИ агентов.
Ранее полный функционал Copilot стоил $20/месяц для индивидуальных пользователей и $30/месяц для корпоративных клиентов.
Помянем тысячи стартапов.
#Microsoft #Copilot #Office
———
@tsingular
🚀 Совет, который спас OpenAI: “Всегда делай API”
В первые годы OpenAI балансировала на грани: фундаментальные модели становились всё дороже, а продукта, который мог бы оплачивать эти расходы, так и не появлялось.
GPT-3 выглядел впечатляюще, но в реальности был слишком «сырой», чтобы построить вокруг него работающий сервис.
Сэм Альтман вспоминает: «Я поднимал градус срочности - нам нужен был продукт, а идей не было».
И тогда в памяти всплыл совет Пола Грэма, основателя Y Combinator:
👉 «Всегда делай API. Что бы ни происходило - сделай API. Хорошие вещи придут сами».
OpenAI без особых ожиданий открыла доступ к GPT-3 через API. «Может, кто-то найдёт применение», - подумали в компании.
И действительно: первыми успехами стали сервисы для копирайтинга - Jasper, Copy.ai. Но самое любопытное оказалось в другом: часть пользователей начинала просто разговаривать с моделью часами напролёт. Это не было мейнстримом, но сигнал оказался настолько сильным, что команда поняла — вот он, настоящий продукт.
📅 30 ноября 2022 года OpenAI запустила ChatGPT как «исследовательский превью» на базе GPT-3.5. Всего за 5 дней им воспользовались более миллиона человек.
🔥 Из скучного API родился продукт, который изменил представление об искусственном интеллекте. И всё началось с одного простого совета.
@ai_machinelearning_big_data
#OpenAI #СэмАльтман #ChatGPT #стартапы
Из xAI за одну ночь уволили 500 человек
Все они работали разметчиками данных. 500 специалистов – это, если что, примерно треть всего подразделения аннотаций данных. А подразделение аннотаций, в свою очередь, является самым большим в xAI.
Увольнения прошли не слишком гладко и красиво: сотрудникам отправили внезапные письма по электронной почте с уведомлением об увольнении и в тот же день отозвали все доступы. На xAI уже сыпятся жалобы, но в это мы углубляться не будем.
Интересно другое: в тот же день (это была пятница) xAI со своего аккаунта в X выложили пост такого содержания:
ИИ-тренеры в xAI приносят огромную пользу. Мы увеличиваем нашу команду ИИ-тренеров в 10 раз!
Мы нанимаем специалистов в таких областях, как STEM, финансы, медицина, безопасность и др. Присоединяйтесь к нам и помогите нам создать искусственный интеллект, ищущий истину!
Доклад Константина Крестникова с BigTechNights.
Константин рассказал про архитектуру универсальных агентов на BTN. И показал открытую реализацию, которую можно развернуть на виртуалке или локально.
Когда она может быть полезной? — Если нужен диалоговый агент с web-интерфейсом (как в ChatGPT), способный самостоятельно выполнять много шагов для решения задачи и писать код для достижения цели.
При этом можно:
- добавить свои Тулы и суб-агентов
- Изменить system prompt
- Использовать практически любую LLM, даже локальную, тем самым сделав решение полностью автономным
В видео показано демо, как агент по запросу пользователя создаёт и обучает ml-модель для предсказания цен на квартиры в Москве (прямо внутри чата!) и потом можно в этом же диалоге спрашивать про разные квартиры, а агент будет их оценивать с помощью только что сделанной модели.
Видео выше. Также можно посмотреть на youtube и rutube.
Агент сделан на LangGraph, лицензия MIT.
#BTN #Сбер
------
@tsingular
Запись выступления на конференции BigTechNights 2025 на площадке Сбербанка 12 сентября
- Обзор текущего состояния решений ИИ в ИБ
- Ключевые риски и способы их предотвращения при разработке агентских систем на базе ИИ
- Полезные фреймворки
Презентация в комментарии.
Rutube
Youtube
Отдельное спасибо команде Сбера, - организация и все доклады отличные, - как появятся в паблике, - тоже поделюсь.
#конференции #Сбербанк #BigTechNights #cybersecurity
———
@tsingular
У Лукоморья дуб зелёный.
Годный нейрорендер по мотивам Пушкина.
#Пушкин #нейрорендер
———
@tsingular
Просто чтобы понять в каком мы таймлайне,- в каких фильмах ИИ захватывает планету не с помощью роботов, а с помощью других людей?
Чисто думаю что бы посмотреть на выходных.
#фильмы #фантастика
------
@tsingular
Copilot теперь поддерживает подключение моделей с Hugging Face
GitHub Copilot интегрировался с Hugging Face - теперь разработчики могут использовать открытые модели типа Kimi K2 и Qwen3, DeepSeek прямо в VSCode и вести разработку не ограничиваясь проприетарным списком Cursor и без шаманства с прокси.
Работает на железе HF Inference Providers.
#Copilot #HuggingFace #VSCode
------
@tsingular
Чем еще заняться вечером в пятницу?
BigTechNights
В 21:50 расскажу про ИБ для ИИ агентов.
https://bigtechnight.ru/online/
#bigtechnights #cybersecurity #конференции
------
@tsingular
Как юристу за пару минут разобраться в 50-страничном договоре? Что делать инженеру, когда «горит лампочка» на производстве? И как ритейлеру сократить запуск маркетинговой кампании с нескольких месяцев до нескольких дней?
Ответ — генеративный ИИ. Он не просто помогает ускорить работу, а меняет саму логику бизнес-процессов.
— В банке нейросети анализируют документы и находят риски;
— В BMW искусственный интеллект помогает инженерам и проверяет качество на конвейере;
— А в Walmart и Carrefour чат-боты уже ведут переговоры с поставщиками и становятся персональными консьержами для покупателей.
Но действительно ли генеративный ИИ даёт конкурентное преимущество, или это просто ещё один инструмент автоматизации? Чем отличаются сценарии внедрения в банке и на заводе? И как не ошибиться с выбором подхода?
Обсуждаем в новом выпуске второго сезона подкаста «Мы и Оно»
Слушайте на сайте Forbes
В плеере Telegram
Apple Podcasts
На «Яндекс.Музыке»
И других стримингах
AI-агент на GigaChat и LangGraph (от архитектуры до валидации) на примере Lean Canvas
Команда GigaChain продолжает делиться гайдами о построении агентов.
В этот раз техлид Константин Крестников показывает процесс построения агентной системы на примере заполнения Lean Canvas — шаблона проработки бизнес-идей для стартапов.
Заполнение Lean Canvas — творческая, но рутинная задача, на которую уходит много времени и усилий команды. А что, если построить агента, который умеет заполнять шаблон по описанию идеи, анализировать конкурентов, учитывать обратную связь и давать хороший черновик — с которым уже можно работать, уточняя детали под специфику проекта.
🔥 Бесплатная книга от инженера Google — Agentic Design Patterns
400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.
📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом
⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.
📚 Читать
@ai_machinelearning_big_data
#AI #Agents #Google #OpenSource #freebook
Выключайте mcp сервера
Ещё на прошедшем стриме мы разгоняли про mcp сервера и я обнаружил, что инструкции mcp тулам занимают охренеть как много токенов!
Тогда я сетовал на browsermcp, инструкции которого занимают 5к токенов!
Сегодня мне понадобилось порисерчить один github repository и я решил поручить это дело Claude Code.
Я установил официальный github mcp, запустил claude, отправил команду /context и увидел, что только этот mcp занимает 46к токенов, Карл!
46к токенов на пустой сессии.
46к токенов это 25% контекстного окна Claude Sonnet 4.
46к токенов это примерно половина контекстного окна, за пределы которого я стараюсь не выходить при работе.
Даже разработчики официального github mcp не чураются описывать все корнер кейсы в инструкциях, чтобы агенты с этим mcp хоть как то работали, но это ведёт к выжиранию контекста!
Вывод:
1. Обязательно пользуйтесь инструментами для мониторинга текущего размера контекста (в CC команда /context, или в расширении ccstatusline можно добавить строчку)
2. Отключайте не нужные mcp сервера