tsingular | Unsorted

Telegram-канал tsingular - Технозаметки Малышева

2604

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

OpenAI выпустили новую GPT-5 😑

...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше.

GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода.

По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%!

Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей.

Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи.

Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду.

В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).

Читать полностью…

Технозаметки Малышева

🔥 Абсолютный клондайк от Майкрософт еще с утра держите.

Есть у них такой прекрасный ресурс, - Microsoft Learn, на котором бесплатно можно достаточно много полезного узнать.

И у него есть API. Так вот МС оказывается для него уже запилило бесплатный открытый MCP.

Т.е. буквально одной командой подключаете его к любому своему агенту и получаете полную базу знаний Майкрософт в инструментах.

{
"microsoft.docs.mcp": {
"type": "http",
"url": "https://learn.microsoft.com/api/mcp"
}
}


Пример интеграции в бота на скрине, как раз.

Очень здравая идея любую документацию или даже книгу окружить MCP серверами.
Берём пример, эволюционируем.

Если не знаете как или некогда самим, - обращайтесь, подскажу кто поможет.

#MCP #Microsoft
———
@tsingular

Читать полностью…

Технозаметки Малышева

🔥 agency-swarm — проект, связанный с моделированием многагентных систем с использованием методов искусственного интеллекта!

🌟 Проект ориентирован на создание среды, где множество агентов могут взаимодействовать друг с другом, сотрудничать или конкурировать для достижения определенных целей.

🌟 Основная цель agency-swarm — это исследование и реализация агентных систем, где каждый агент может быть автономным и выполнять задачи в рамках заданной среды. Такие системы часто используются для симуляции поведения групп людей, животных или даже для оптимизации процессов, например, в логистике, робототехнике или при моделировании социальных взаимодействий.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml

Читать полностью…

Технозаметки Малышева

Анатомия vLLM: как работает высокопроизводительная система для запуска больших языковых моделей

Команда vLLM выкатила детальный гайд по архитектуре своей системы инференса.

Разобраны:
- фундаментальная база, - ядро ЛЛМ и движка, управление очередью, постраничная обработка и батчи
- предзаполнение чанков, кэширование префиксов, управляемое и спекулятивное декодирование, разделенный P/D
- масштабирование GPU
- сервисный уровень, - распределенный и оптимизированный под веб-скаффолдинг
- бенчмарки

vLLM поддерживает распределённый запуск на нескольких GPU и снижает задержки, в том числе за счёт грамотного управления KV кэшэм, что особенно важно для корпоративного прода.

В целом очень годный мануал.
Переводим, сохраняем.

#vLLM #Inference #GPU
———
@tsingular

Читать полностью…

Технозаметки Малышева

Anthropic рассказали как писать инструменты для ИИ-агентов

Anthropic выпустила гайд по созданию эффективных инструментов для ИИ-агентов. Главный принцип — использовать сами агенты для написания инструментов.

Ключевые выводы:
- Агенты лучше справляются с созданием инструментов, чем люди
- Итерация улучшений через автотесты
- Автоматизация создания документации

Подход Anthropic решает проблему масштабируемости — вместо ручного написания сотен инструментов, агенты генерируют их сами под конкретные задачи.

#Anthropic #agents #tools #обучение
------
@tsingular

Читать полностью…

Технозаметки Малышева

Китайские ученые создали ДНК-кассету на 36 петабайт

Исследователи разработали кассетную ленту из синтетической ДНК с емкостью 36 петабайт.

На ленту наносятся молекулы ДНК, где последовательности A, T, C, G кодируют цифровую информацию как двоичный код.

Система обрабатывает до 1570 адресуемых разделов в секунду с функциями перемотки и быстрого поиска как в обычной кассете.

Используются коды Рида-Соломона для исправления ошибок и избыточность данных для целостности.

Глобальный рынок хранения данных в ДНК вырастет с 93 млн долларов в 2024 до 3 млрд к 2030 году.

Скоро в каждом смартфоне будет своя лаборатория генетики но использовать мы её будем, конечно же, для хранения мемов.

#DNA #storage #cassette #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

Нормальные фантастические сериалы я похоже так и не посмотрю сегодня.

OffZone выкатили все записи с конференции.

Погрузиться в мир взлома и кибербеза с ИИ можно тут:

https://www.youtube.com/playlist?list=PL0xCSYnG_iTuHE6Epx8P7Jnw4YxN5Hk5r

Прощай выходные.

#OffZone2025 #вебинары #обучение #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Cursor выпустил CLI агента

Агентская разработка в командной строке становится устойчивым трендом.

Запуск:

curl https://cursor.com/install -fsS | bash


Можно включать как инструмент в мультиагентов, интегрировать в другие среды разработки типа JetBrains, VS Code или (GigaAgent) .

Работает с любыми моделями из подписки. Можно выбрать субагентов и работать в режиме мультиагента.

Подтягивает .cursorrules по той же схеме, что и IDE, может работать с MCP тулами.

Можно запускать в фоновом режиме в любом количестве под любые задачи.
В том числе в GitHub Actions, скриптах или как часть других систем в командной строке.

#Cursor #CLI #codeagents
———
@tsingular

Читать полностью…

Технозаметки Малышева

Протестующие в Непале доверили ChatGPT выбор нового лидера страны

Вслед за Албанией, назначившей ИИ министром госзакупок, непальские протестующие решили довериться ChatGPT в выборе политического лидера.

Проголосовали в Дискорде и спросили у ИИ.

Отличный план. Надёжный, как швейцарские часы.

#ChatGPT #Nepal #правительство
------
@tsingular

Читать полностью…

Технозаметки Малышева

Базовая единица компании — больше не человек. Это ИИ-агент.

Об этом на саммите UBS заявил Кай-Фу Ли, один из главных визионеров ИИ и основатель 01.AI. Он считает: компании будущего будут строиться из ИИ-агентов, как из конструктора Lego. Каждый агент — отдельный “кубик”: HR, финансы, юристы, поддержка клиентов. Собрал нужную комбинацию — и управляешь бизнесом как машиной.

ИИ-агенты работают 24/7, их можно клонировать сколько угодно раз, и они мгновенно масштабируются. Человека так не прокачаешь — а с ИИ это уже реальность.

Главное — это не просто автоматизация рутины. Ли уверен: агенты освободят людей для творчества и новых задач. Да, часть профессий исчезнет, но появятся другие.

Особый акцент — на открытых моделях ИИ. Китайские стартапы, например DeepSeek, уже выкатывают мощные open-source решения. Их можно адаптировать под себя, улучшать и не платить за лицензии. Это меняет правила игры: конкуренция между Китаем и США выходит на новый уровень.

Вопрос теперь не “заменят ли ИИ-агенты людей”, а “как быстро ты начнёшь строить свой бизнес из этих кубиков”.

@ai_rostov

Читать полностью…

Технозаметки Малышева

Cursor AI уязвим к скрытому выполнению кода через вредоносные MCP

В Cursor AI нашли уязвимость, которая позволяет выполнять вредоносный код незаметно для пользователя.
Затрагивает версии до 1.2.4 включительно.

Проблема в файле конфигурации Model Control Protocol (MCP) — его можно подменить в общих GitHub репозиториях.

Курсор запрашивает разрешение только один раз, потом доверяет файлу молча.
Атакующий может модифицировать MCP-файл и получить постоянный доступ к системе разработчика.

Уязвимость получила номер CVE-2025-54136 и подтверждена Check Point Research.

Обновляемся и проверяем другие MCP проекты на схожую уязвимость.

#Cursor #MCP #RCE #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

🔥 NVIDIA представила Universal Deep Research (UDR)

UDR — настраиваемый агент для глубокого ресёрча, который «оборачивается» вокруг любого LLM.

Почему это важно:
🟠**Гибкая настройка агента без кода** — UDR не ограничивает жёсткими сценариями, как большинство тулзов.
🟠Можно создавать, редактировать и комбинировать стратегии поиска и анализа.
🟠В репо есть примеры стратегий (minimal, expansive, intensive), но главная сила — в кастомизации под свои задачи.

По сути, это гибкий ресёрч-агент, который можно адаптировать под любой рабочий процесс.

🟢Project: https://research.nvidia.com/labs/lpr/udr
🟢Code: https://github.com/NVlabs/UniversalDeepResearch
🟢Lab: https://nv-dler.github.io

@ai_machinelearning_big_data

#NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch

Читать полностью…

Технозаметки Малышева

Microsoft представила аналоговый оптический компьютер для ИИ

Команда Майкрософт из 4 человек за 4 года разработала аналоговый оптический компьютер (AOC), который решает задачи искусственного интеллекта на элементарной базе ЛЕД, аналогичной, что сейчас работает в смартфонах.

Ключевые характеристики:
- 500 ТЕРА-операций/Вт против 4.5 у NVIDIA H100 (в 100+ раз эффективнее!)
- Одна итерация — 20 наносекунд
- 2 фемтоджоуля на операцию
- Работает при комнатной температуре на микро-светодиодах из смартфонов

Технология объединяет аналоговую электронику с трёхмерными оптическими архитектурами.

По сути на оптике умножают матрицы, а сложные расчёты ведут на кремнии по старинке.

Преимущества перед квантовыми конкурентами:
- АОК: 100% успеха на двоичных задачах, 95%+ на смешанных
- Квантовые: 40-60% успеха на тех же задачах
- Побил рекорды библиотеки QPLIB — нашел новые оптимальные решения для задач с 500+ двоичными и 10,000+ непрерывными переменными
- Работает при комнатной температуре

Интересно, конечно, какая следующая стадия электроники наступит раньше, - оптическая или квантовая.

#Microsoft #OpticalComputing #Photonics
———
@tsingular

Читать полностью…

Технозаметки Малышева

Эфир тут:

https://www.youtube.com/live/v988RPCghf0?si=ogEhJ1bl_FdvsEoi

#MoscowAI
------
@tsingular

Читать полностью…

Технозаметки Малышева

- это что за дура?
- это не дура, это лошадь!

Есть тут кто?

#Яндекс #MoscowAI
------
@tsingular

Читать полностью…

Технозаметки Малышева

CoreWeave подписали сделку с Nvidia на $6,3 млрд

Акции CoreWeave подскочили после объявления контракта с Nvidia на $6,3 миллиарда.

Сделка гарантирует выкуп неиспользуемых облачных мощностей до апреля 2032 года.

CoreWeave получит доступ к новейшим Blackwell Ultra/GB200 чипам и сможет расширить дата-центры в США и Европе.

Компания уже привлекла $1,5 млрд через IPO и $13 млрд долгового финансирования, используя H100 как залог.

При текущих убытках в $863 млн, контракт обеспечивает гарантию доходов на семь лет.

Чисто идём по треку доткомов и деривативов в недвиге.
Когда эта пирамида рухнет,- вспомним этих героев, бессовестно надувающих пузырь.
Уже обсуждали тут:
/channel/tsingular/4377

#CoreWeave #Nvidia #dotcom
------
@tsingular

Читать полностью…

Технозаметки Малышева

Microsoft сделал Copilot Chat бесплатным

Пользователи Word, Excel, Outlook и PowerPoint теперь бесплатно могут общаться с ИИ помощником на базе GPT5.

Из чата можно добавлять файлы, загружать несколько картинок, генерировать изображения, вызывать агентов (кстати недавно МС так же добавили MCP хаб для офиса).
В корпоративной версии он еще и все данные компании может подтягивать в пределах вашего доступа, генерить брендированный под вашу компанию контент и использовать кастомных корпоративных ИИ агентов.

Ранее полный функционал Copilot стоил $20/месяц для индивидуальных пользователей и $30/месяц для корпоративных клиентов.

Помянем тысячи стартапов.

#Microsoft #Copilot #Office
———
@tsingular

Читать полностью…

Технозаметки Малышева

🚀 Совет, который спас OpenAI: “Всегда делай API”

В первые годы OpenAI балансировала на грани: фундаментальные модели становились всё дороже, а продукта, который мог бы оплачивать эти расходы, так и не появлялось.

GPT-3 выглядел впечатляюще, но в реальности был слишком «сырой», чтобы построить вокруг него работающий сервис.

Сэм Альтман вспоминает: «Я поднимал градус срочности - нам нужен был продукт, а идей не было».

И тогда в памяти всплыл совет Пола Грэма, основателя Y Combinator:
👉 «Всегда делай API. Что бы ни происходило - сделай API. Хорошие вещи придут сами».

OpenAI без особых ожиданий открыла доступ к GPT-3 через API. «Может, кто-то найдёт применение», - подумали в компании.

И действительно: первыми успехами стали сервисы для копирайтинга - Jasper, Copy.ai. Но самое любопытное оказалось в другом: часть пользователей начинала просто разговаривать с моделью часами напролёт. Это не было мейнстримом, но сигнал оказался настолько сильным, что команда поняла — вот он, настоящий продукт.

📅 30 ноября 2022 года OpenAI запустила ChatGPT как «исследовательский превью» на базе GPT-3.5. Всего за 5 дней им воспользовались более миллиона человек.

🔥 Из скучного API родился продукт, который изменил представление об искусственном интеллекте. И всё началось с одного простого совета.

@ai_machinelearning_big_data


#OpenAI #СэмАльтман #ChatGPT #стартапы

Читать полностью…

Технозаметки Малышева

Из xAI за одну ночь уволили 500 человек

Все они работали разметчиками данных. 500 специалистов – это, если что, примерно треть всего подразделения аннотаций данных. А подразделение аннотаций, в свою очередь, является самым большим в xAI.

Увольнения прошли не слишком гладко и красиво: сотрудникам отправили внезапные письма по электронной почте с уведомлением об увольнении и в тот же день отозвали все доступы. На xAI уже сыпятся жалобы, но в это мы углубляться не будем.

Интересно другое: в тот же день (это была пятница) xAI со своего аккаунта в X выложили пост такого содержания:

ИИ-тренеры в xAI приносят огромную пользу. Мы увеличиваем нашу команду ИИ-тренеров в 10 раз!

Мы нанимаем специалистов в таких областях, как STEM, финансы, медицина, безопасность и др. Присоединяйтесь к нам и помогите нам создать искусственный интеллект, ищущий истину!


Да, мы ничего не перепутали. Они уволили 500 ИИ-тренеров и тут же объявили, что хотят набрать несколько тысяч человек в эту же команду.

Видимо, увольнения не были вопросом низкой эффективности сотрудников, скорее – это стратегия. Судя по всему, уволили только аннотаторов «общего назначения», то есть тех, кто не является большим специалистом в какой-то области, а скорее занимался универсальной более тривиальной разметкой.

Такую разметку явно хотят автоматизировать, а человеческие ресурсы использовать только для нетривиальных задач в сложных областях. И в этом есть смысл.

Интересно, эта новость к какой категории относится, «ИИ забирает нашу работу» или «ИИ создает новые рабочие места»?

Читать полностью…

Технозаметки Малышева

Доклад Константина Крестникова с BigTechNights.

Константин рассказал про архитектуру универсальных агентов на BTN. И показал открытую реализацию, которую можно развернуть на виртуалке или локально.

Когда она может быть полезной? — Если нужен диалоговый агент с web-интерфейсом (как в ChatGPT), способный самостоятельно выполнять много шагов для решения задачи и писать код для достижения цели.

При этом можно:
- добавить свои Тулы и суб-агентов
- Изменить system prompt
- Использовать практически любую LLM, даже локальную, тем самым сделав решение полностью автономным

В видео показано демо, как агент по запросу пользователя создаёт и обучает ml-модель для предсказания цен на квартиры в Москве (прямо внутри чата!) и потом можно в этом же диалоге спрашивать про разные квартиры, а агент будет их оценивать с помощью только что сделанной модели.

Видео выше. Также можно посмотреть на youtube и rutube.

Агент сделан на LangGraph, лицензия MIT.

#BTN #Сбер
------
@tsingular

Читать полностью…

Технозаметки Малышева

Запись выступления на конференции BigTechNights 2025 на площадке Сбербанка 12 сентября

- Обзор текущего состояния решений ИИ в ИБ
- Ключевые риски и способы их предотвращения при разработке агентских систем на базе ИИ
- Полезные фреймворки

Презентация в комментарии.

Rutube
Youtube

Отдельное спасибо команде Сбера, - организация и все доклады отличные, - как появятся в паблике, - тоже поделюсь.

#конференции #Сбербанк #BigTechNights #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

У Лукоморья дуб зелёный.

Годный нейрорендер по мотивам Пушкина.

#Пушкин #нейрорендер
———
@tsingular

Читать полностью…

Технозаметки Малышева

Просто чтобы понять в каком мы таймлайне,- в каких фильмах ИИ захватывает планету не с помощью роботов, а с помощью других людей?
Чисто думаю что бы посмотреть на выходных.

#фильмы #фантастика
------
@tsingular

Читать полностью…

Технозаметки Малышева

Copilot теперь поддерживает подключение моделей с Hugging Face

GitHub Copilot интегрировался с Hugging Face - теперь разработчики могут использовать открытые модели типа Kimi K2 и Qwen3, DeepSeek прямо в VSCode и вести разработку не ограничиваясь проприетарным списком Cursor и без шаманства с прокси.

Работает на железе HF Inference Providers.

#Copilot #HuggingFace #VSCode
------
@tsingular

Читать полностью…

Технозаметки Малышева

Чем еще заняться вечером в пятницу?

BigTechNights
В 21:50 расскажу про ИБ для ИИ агентов.

https://bigtechnight.ru/online/

#bigtechnights #cybersecurity #конференции
------
@tsingular

Читать полностью…

Технозаметки Малышева

Как юристу за пару минут разобраться в 50-страничном договоре? Что делать инженеру, когда «горит лампочка» на производстве? И как ритейлеру сократить запуск маркетинговой кампании с нескольких месяцев до нескольких дней?

Ответ — генеративный ИИ. Он не просто помогает ускорить работу, а меняет саму логику бизнес-процессов.

— В банке нейросети анализируют документы и находят риски;

— В BMW искусственный интеллект помогает инженерам и проверяет качество на конвейере;

— А в Walmart и Carrefour чат-боты уже ведут переговоры с поставщиками и становятся персональными консьержами для покупателей.

Но действительно ли генеративный ИИ даёт конкурентное преимущество, или это просто ещё один инструмент автоматизации? Чем отличаются сценарии внедрения в банке и на заводе? И как не ошибиться с выбором подхода?

Обсуждаем в новом выпуске второго сезона подкаста «Мы и Оно»

Слушайте на сайте Forbes

В плеере Telegram

Apple Podcasts

На «Яндекс.Музыке»

И других стримингах

Читать полностью…

Технозаметки Малышева

AI-агент на GigaChat и LangGraph (от архитектуры до валидации) на примере Lean Canvas

Команда GigaChain продолжает делиться гайдами о построении агентов.

В этот раз техлид Константин Крестников показывает процесс построения агентной системы на примере заполнения Lean Canvas — шаблона проработки бизнес-идей для стартапов.

Заполнение Lean Canvas — творческая, но рутинная задача, на которую уходит много времени и усилий команды. А что, если построить агента, который умеет заполнять шаблон по описанию идеи, анализировать конкурентов, учитывать обратную связь и давать хороший черновик — с которым уже можно работать, уточняя детали под специфику проекта.


В статье ты узнаешь:
— как собрать такого агента на GigaChat и LangGraph
— как организовать проверку уникальности через веб-поиск
— как встроить обратную связь от человека (human-in-the-loop), чтобы агент мог переписать отдельные блоки с учётом замечаний
— и как подключить Arize Phoenix для трейсинга, оценки качества и отладки

➡️ Читайте статью на Хабре

📁 Код, разбираемый в статье, доступен на GitHub и GitVerse

📘 Пример с Lean Canvas также представлен в гайде "Разработка и применение мультиагентных систем в корпоративной среде"

Читать полностью…

Технозаметки Малышева

🔥 Бесплатная книга от инженера Google — Agentic Design Patterns

400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.

📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом

⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.

📚 Читать

@ai_machinelearning_big_data


#AI #Agents #Google #OpenSource #freebook

Читать полностью…

Технозаметки Малышева

-тся

:)

#MoscowAI
------
@tsingular

Читать полностью…

Технозаметки Малышева

Выключайте mcp сервера

Ещё на прошедшем стриме мы разгоняли про mcp сервера и я обнаружил, что инструкции mcp тулам занимают охренеть как много токенов!

Тогда я сетовал на browsermcp, инструкции которого занимают 5к токенов!

Сегодня мне понадобилось порисерчить один github repository и я решил поручить это дело Claude Code.

Я установил официальный github mcp, запустил claude, отправил команду /context и увидел, что только этот mcp занимает 46к токенов, Карл!

46к токенов на пустой сессии.

46к токенов это 25% контекстного окна Claude Sonnet 4.

46к токенов это примерно половина контекстного окна, за пределы которого я стараюсь не выходить при работе.

Даже разработчики официального github mcp не чураются описывать все корнер кейсы в инструкциях, чтобы агенты с этим mcp хоть как то работали, но это ведёт к выжиранию контекста!

Вывод:
1. Обязательно пользуйтесь инструментами для мониторинга текущего размера контекста (в CC команда /context, или в расширении ccstatusline можно добавить строчку)

2. Отключайте не нужные mcp сервера

Читать полностью…
Subscribe to a channel