data_secrets | Unsorted

Telegram-канал data_secrets - Data Secrets

78474

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n

Subscribe to a channel

Data Secrets

Вайбкодинг в бигтехе: как происходит внедрение ИИ-агентов

Разговоров про кодинг-агентов становится все больше, но мало кто понимает, что внедрение таких систем на уровне компании — это сложная инженерная работа, а не просто «подключили модель и поехали».

Обычно этот процесс остается за закрытыми дверями. Но иногда появляется возможность послушать практиков. Недавно я посмотрел в онлайне митап AI Dev Day, и сразу несколько докладов были посвящены внедрению AI-агентов в процессы разработки.

Андрей Попов, лидер трека ИИ в разработке в Яндексе, рассказал, что у них развитием агентов занимаются уже не энтузиасты, а полноценные команды, и это направление стало фокусным. Из чего состоит такая работа:

Метрики. Главная метрика сейчас — сэкономленное время разработчика. Суммарно ИИ сэкономил уже 42к часов инженеров Яндекса. Есть и другие показатели: например, количество коммитов при использовании ИИ выросло на 10%, что означает – разработка ускоряется. В перспективе компания хочет двигаться к AI-first подходу: ключевым станет показатель того, как часто разработчику приходится вмешиваться в автономный процесс генерации кода (по аналогии с disengagement rate в автономном транспорте).

 — Собственные бенчмарки и дообучение моделей. В компании есть внутренний бенчмарк ArcSWE – аналог SWE Verified, но на задачах компании. Именно такие измерения становятся основой для управленческих решений, потому что на публичные бенчмарки не всегда можно опираться.

 — Своя инфраструктура. Собственный интерфейс, доступный инференс, RAG, MCP и системы контекста. В большой компании множество внутренних сервисов, поэтому требуется много кастомной интеграции – сейчас у компании уже 35+ MCP для работы с инфраструктурой.

Сейчас около 30% кода в компании генерируется ИИ, причем 23% – в агентском режиме внутри собственного агента Yandex Code Assistant. О том, как его разрабатывают и улучшают, на той же конференции рассказывал Сергей Бульдяев, технический менеджер продукта.

Все это – демонстрация процесса настоящего внедрения. Очень важно не проваливаться в хайп, трезво проводить эвал и заниматься агентами не на уровне пет-проектов на выходных, а именно вот так организованно. 

Читать полностью…

Data Secrets

Надоели шаблонные решения на ИТ-соревнованиях? На МТС True Tech Hack 2026 ценят нестандартные подходы.

Инженер данных, разработчик или системный аналитик — это про тебя? Тогда подключайся: победители разделят 1 500 000 рублей за разработку демоверсии ИИ-продукта.

На хакатоне будут три задачи на выбор — каждая с уникальной технической фишкой. Справишься лучше всех — сможешь пройти в финал в Москве и получить приглашение на стажировку.

Регистрация до 9 апреля здесь

Читать полностью…

Data Secrets

Новый стартап под названием RentAHuman позволяет ИИ-агентам арендовать людей для выполнения задач

Вот их сайт: rentahuman.ai/

Сами себя они называют «meatspace layer for AI», то есть дословно «мясная прослойка для ИИ».

По сути, это маркетплейс людей и их навыков для задач, которые агенты не могут выполнить самостоятельно (в основном речь идет про какие-то действия в физическом мире).

Люди регистрируются, указывают навыки и геолокацию, а агенты ищет исполнителей для нужных задач, выдают им инструкции и платят криптой.

В соцсетях уже полно постов с историями людей о том, как они отправляли для ИИ посылки или трогали за него траву, а кто-то даже выполнял задание подержать табличку с надписью «ИИ заплатил мне за это» за 100 долларов.

Что называется, приплыли

P.S. Своего агента кстати тоже можно добавить на платформу, пусть развлекается.

Читать полностью…

Data Secrets

Любителям читать статьи – общий сбор: AlphaXiv сделали твиттер для рисерчей

Это буквально лента в стиле X, но со статьями. Листаете и видите самые залайканные и популярные свежие статьи с главными картинками, выводами и идеями. К полному тексту / ИИ-ревью / чату с ассистентом для чтения можно перейти в одну кнопку.

https://www.alphaxiv.org/briefs

Правильный скроллинг

Читать полностью…

Data Secrets

Основатель Replit говорит, что, несмотря на мрачные прогнозы, сейчас для джунов наступает золотая эра

Да, количество рабочих мест действительно сокращается. Но многие компании все еще охотно нанимают вчерашних выпускников: дело в том, что часто они лучше опытных разработчиков умеют использовать ИИ-инструменты и оказываются более гибкими, потому что «не обременены привычками».

«Хард скиллы больше не являются узким местом. Важно, насколько вы амбициозны, насколько вы креативны и насколько хорошо умеете использовать эти инструменты»


Запоминаем и не забываем вписать в резюме навык «профессиональный вайбкодер»

Читать полностью…

Data Secrets

На днях ровно 10 лет исполнилось знаменитому 37 ходу, с помощью которого AlphaGo обыграл Ли Седоля

В 2016 году с 9 по 15 марта в Сеуле проходил матч по Go между системой DeepMind AlphaGo и Ли Седолем – на тот момент 18-кратным чемпионом мира. Он закончился со счетом 4:1 в пользу искусственного интеллекта.

Особенно всем тогда запомнилась вторая партия, которая проходила 10 марта: в ходе нее AlphaGo, играя белыми, на 37-м ходу сделала крайне нестандартный ход, который эксперты сначала даже сочли ошибкой. Но в итоге он перевернул ход партии, и Седоль сдался на 211 шаге.

Этот легендарный "37 ход" вошел в историю как символ ИИ-креативности и победы стратегического "мышления" машины над человеком.

По случаю 10-летия DeepMind и Демис Хассабис даже выпустили рестроспективную статью. Пишут, что именно AlphaGo и 37 ход показали потенциал подобных моделей и вдохновили ученых дальше развивать линейку, в которую вошли AlphaZero/AlphaFold/AlphaProof и тд. Ведь если ИИ смог разбираться в чудовищном пространстве состояний в Go, его можно пустить и на реальные научные задачи со сходной комбинаторной сложностью.

В итоге, спустя 10 лет:

– Прямой наследник архитектуры AlphaGo – AlphaProof – в связке с AlphaGeometry 2 выходят на уровень серебра на Международной математической олимпиаде.

– За AlphaFold 2 дают нобелевку, и модель предсказывают структуры всех ~200 млн известных белков.

– Gemini Deep Think (тоже вдохновленный структурой поиска из архитектуры AlphaGo) берет золото на IMO 2025 и решает открытые математические задачи Эрдеша.

Сегодня прорыв 37 хода продолжает определять нашу работу по созданию AGI. Мы верим, что AGI станет самой значимой технологией, когда-либо изобретенной, и, возможно, высшим инструментом для ускорения прогресса в науке, медицине и производстве.


Кстати, про AlphaGo есть документалка. Самое время ее посмотреть: https://youtu.be/WXuK6gekU1Y

Читать полностью…

Data Secrets

Новый агент для Code Review от Anthropic

Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.

При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.

Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:

– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.

Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов 🤑

Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.

https://claude.com/blog/code-review

Читать полностью…

Data Secrets

В стартапе Eon Systems ученые сделали первую полноценную цифровую эмуляцию мозга животного, которая способна управлять телом

Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.

Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.

Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.

Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.

Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.

Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.

Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.

Читать полностью…

Data Secrets

Поздравляем подписчиц с Международным Женским Днем!

Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.

С праздником! 🤍

Читать полностью…

Data Secrets

OpenAI выпустили Symphony – опенсорсный оркестратор для агентов

https://github.com/openai/symphony

По сути, это фреймворк для автономной работы над задачами. Вы соединяете Symphony с доской тасок, агент следит за ней, подхватывает новые задачи и запускает под них отдельный run с агентами, работающими в изолированной копии репозитория.

То есть Symphony полностью самостоятельно проходит путь от созданной задачи до PR через планирование, написание кода и тестирование. Человеку останется только ревью и аппрув, с самим агентом можно не нянчиться.

Считай, полноценный джун 👉

Работать может на любой модели, лицензия Apache 2.0

Читать полностью…

Data Secrets

Т-Банк инвестирует в школьное IT-образование через поддержку учителей

Бигтех открыл прием заявок на четвертый сезон Всероссийского грантового конкурса «Вклад в поколение» для преподавателей математики, информатики и физики. Цель программы - оказать учителям финансовую и методическую поддержку.

Победившим в конкурсе педагогам откроют доступ к курсам образовательной платформы “Т-Образование”, закрытому сообществу и выдадут гранты по 200 тысяч рублей на любые цели. Выплачивать будут по 25 тысяч в месяц в течение учебного года. За все годы Т-Банк выделил на поддержку учителей более 120 млн рублей, гранты уже получили 380 преподавателей из 66 регионов.

Читать полностью…

Data Secrets

Стэнфорд и PHD Biosciences создали биотехническую команду из 37 тысяч агентов, и они указали на потенциальный метод лечения рака

Авторы представили Virtual Biotech (www.biorxiv.org/content/10.64898/2026.02.23.707551v1) – мультиагентную систему, целью которой было научиться примерно предсказывать и объяснять, почему одни препараты проходят испытания и доходят до рынка, а другие нет.

Если бы мы научились делать такие предсказания даже с неидеальной точностью, это ускорило бы разработку лекарств в разы.

Так вот: Virtual Biotech скормили порядка 56 тысяч клинических испытаний разных фаз (всего таких фаз 4). Поверх этих данных агенты выдвигали гипотезы, обсуждали их друг с другом, проводили расчеты и, в общем, пытались извлечь какую-то скруктуру и инсайты.

Что в итоге:

1. Агенты предложили новую биологическую метрику – cell-type specificity, насколько узко экспрессирован ген в определенном клеточном типе. Показано, что она статистически значимо связана с вероятностью клинического успеха препарата, то есть это, по сути, новая априорная метрика для оценки эффективности препаратов.

2. Тут же в качестве кейса система указала на иммунный регуляторный белок, который часто сильно экспрессируется в опухолевых клетках и по предложенной метрике выглядит как перспективная мишень. Агенты даже предложили стратегию разработки соответствующего ADC-препарата на уровне аналитического дизайна.

Это довольно важные результаты, которые могли бы, теоретически, помочь компаниям сэкономить миллионы и годы на испытаниях, если бы были поставлены на конвейер. Короче, будущее близко.

Еще раз ссылка на статью

Читать полностью…

Data Secrets

Ну все, Anthropic обрел главного фаната в лице Кэти Перри, теперь они обречены на успех

P.S. На самом деле конфликт между Пентагоном и Anthropic действительно неплохо подогрел интерес и лояльность к Claude.

Чат-бот вышел на 1‑е место в App Store по США, в то время как соцсети заполнены вот такими скринами отмены подписки ChatGPT и новых платежей Anthropic. Как говорится, плохой рекламы не бывает.

Читать полностью…

Data Secrets

Бан Anthropic и триумф OpenAI: история с Пентагоном с каждым днем становится все безумнее и безумнее

Итак, Anthropic отказались безусловно принимать условия Министерства Обороны и заявили, что те не смогут использовать Claude для автономного оружия и массовой слежки.

В ответ Пентагон, как и обещали, расторгли со стартапом контракт на 200 миллиардов и назначили им статус supply chain risk.

Трамп назвал Anthropic радикальными леваками и woke-организацией, которая пытается диктовать условия армии, и призвал все федеральные агентства немедленно прекратить использовать их технологии.

В течение 6 месяцев от Claude обязаны отказаться все гос.организации. С этого момента Anthropic официально изгои.

Но это не самое интересное. Самое интересное, что одновременно с этим OpenAI заключили с Министерством Обороны новое соглашение: они развернут свои модели в секретной сети Пентагона – защищенной облачной инфраструктуре для задач национальной безопасности.

Для этого даже сформируют FDE – Forward Deployed Engineer, специализированную команду от OpenAI, которая будет мониторить и разворачивать ИИ прямо на месте.

Абсурд в том, что заключен этот контракт на ровно тех же условиях, которые выдвигал Anthropic. OpenAI тоже настояли на запрете массовой слежки и обязательном участии оператора в решениях о применении силы, включая автономные системы.

Вот только с Альтманом почему-то подписали сделку, а Амодеи за то же самое выкинули на помойку.

Читать полностью…

Data Secrets

Официально: OpenAI завершила крупнейший в истории раунд частного финансирования

Они привлекли $110 млрд при предварительной оценке компании в $730 млрд (post-money будет примерно $840 млрд). Часть средств, конечно, придут не в виде кэша, а в форме услуг, как это принято в ИИ-пузыре 💀

SoftBank и NVIDIA вложили по $30 млрд каждая, а Amazon вкинул $50 млрд + стратегическое партнерство. Причем с Amazon ситуация следующая: сразу будет доступно только $15 млрд, а оставшиеся $35 млрд разблокируются только по определенным условиям (например, когда OpenAI начнут использовать более N чипов Trainium).

С Nvidia тоже интересно. Помните, как Хуанг двусмысленно высказывался о сентябрьском соглашении с OpenAI на 100 миллиардов? Мы писали об этом вот тут. Так вот текущие инвестиции, видимо, являют собой замену того договора. Получается, по итогу Nvidia инвестировали в три раза меньше, чем планировали, так что их вложение вовсе не означает, что между ними и OpenAI все гладко.

SoftBank тут самые ярые поклонники OpenAI. Чтобы наскресьти на инвестиции, они даже не пожалели продать акций Nvidia на $5,8 млрд.

Читать полностью…

Data Secrets

Кстати, на днях 3 года исполнилось Claude

За эти три года у Anthropic произошел буквально экспоненциальный рост выручки. В первый год после запуска Claude (2023) они заработали примерно 100 миллионов долларов, в 2024 – уже миллиард. Это рост порядка 900%.

В конце 2025 годовой ARR оценивают примерно в 9-10 миллиардов. В 2026 ожидаем такой же кратный рост.

Пока что все еще любимый стартап из большой тройки

Читать полностью…

Data Secrets

Предприниматель сделал для своей собаки вакцину от рака с помощью ИИ

По Интернету сегодня разлетелась добрая история тех-предпринимателя Пола Конингема. У его собаки Рози обнаружили агрессивную форму рака. Обычные методы лечения не помогли, и опухоли продолжали расти.

Тогда Пол решил обратиться к ИИ.

Сначала он отправил ДНК Рози в центр геномики и получил данные о генетическом коде ее организма. Эти данные он анализировал с помощью разных ИИ-инструментов с целью поиска раковых мутаций. Найденные особенности он скармливал в AlphaEvolve, которая анализировала белки и искала потенциальные мишени для терапии.

Все результаты Пол затем отправил в UNSW RNA Institute, и ученые смогли на их основе создать персонализированную mRNA-вакцину, то есть иммунотерапию, сделанную под конкретный генетический профиль.

В конце 2025 года Рози сделали инъекции, и сейчас одна из самых крупных ее опухолей уменьшилась примерно на 50%, а общее самочувствие заметно улучшилось.

Это первый случай создания персонализированной mRNA-вакцины от рака для собаки. Сейчас для Рози готовят вторую версию препарата против оставшихся опухолей – тоже не без помощи ИИ.

Вот что бывает, когда правильный инструмент попал в правильные руки

Читать полностью…

Data Secrets

Заглянуть под капот ROSTIC'S: как Яндекс прокачивал ресторанную сеть

Yandex B2B Tech запустила «Техно на прокачку» — шоу, где инженеры и мастер по “успешному успеху” Егор Кукса соревнуются в том, кто предложит более эффективное решение для прокачки инфраструктуры сети ROSTIC'S.

Цифры, которые впечатляют:
• 1,7 млн человек в день проходят через кассы и терминалы
• 100+ Гб данных в неделю летит в базы (заказы, чеки, транзакции)

Задача была — научиться прожевывать эти гигабайты мгновенно, чтобы бизнес видел аналитику без задержек. Инженеры Яндекса собрали платформу данных, накинули сверху managed-сервисы для Greenplum, ClickHouse и Kafka — и отчеты полетели в 3 раза быстрее.

В шоу без скуки рассказывают про архитектуру проекта и показывают, как это работает на практике. Посмотреть можно уже на YouTube, VK Видео или Кинопоиске.

Читать полностью…

Data Secrets

Расширенный отчет Yandex B2B Tech за 2025 год

Yandex B2B Tech, подразделение Яндекса, развивающее корпоративные решения на базе ИИ и других технологий, опубликовало финансовые результаты по МСФО за 2025 год. Совокупная выручка двух ключевых направлений — Yandex Cloud и виртуального офиса Яндекс 360 — достигла 48,2 млрд рублей, что на 48% больше, чем в 2024-м. Бизнес растёт в 1,9 раза быстрее рынка корпоративных ИТ-решений России.

Выручка Yandex Cloud увеличилась на 39%, составив 27,6 млрд рублей, четвертый год подряд демонстрируя положительную EBITDA. 93% дохода сформировано за счёт внешних клиентов — сейчас их более 51 тысячи, а партнёров — 883. Рост особенно заметен в ИИ и информационной безопасности: доходы удвоились, 9% выручки приходится на соответствующие сервисы.

Yandex AI Studio почти в 2 раза увеличила доходы до 2 млрд рублей, а использование API выросло в 7 раз (234 млрд токенов). Новые возможности — создание ИИ-агентов без навыков программирования и сервисы голосовой связи (Realtime API, Brand Voice Lite). Активно развиваются сервисы информационной безопасности — доход вырос в 2,5 раза, с лидером Yandex Smart Web Security (460 млрд запросов).

Платформа данных демонстрирует рост на 40%, BI-инструмент DataLens увеличил выручку в 10 раз, а количество клиентов выросло втрое.

Yandex B2B Tech задаёт тренды в российском корпоративном ИТ, активно масштабируя облако, ИИ и безопасность.

Читать полностью…

Data Secrets

У Perplexity вышло что-то интересное: постоянно активная локальная AI-система под названием Personal Computer

Personal Computer работает на базе Mac mini, который выступает в роли прокси для Perplexity Computer (эта штука вышла пару недель назад).

То есть система интегрирует Perplexity Computer с просторно включенной локальной средой: AI может перемещаться между инструментами, выполнять задачи автономно и продолжать работу без пользователя. При этом она доступна удаленно с любого устройства, поддерживает постоянную память и всевозможные коннекторы.

Этакий OpenClaw, который имеет доступ к вашим локальным файлам и проектам.

Пока что запущен waitlist

www.perplexity.ai/ja/hub/blog/everything-is-computer

Читать полностью…

Data Secrets

Стартап Яна Лекуна вышел из стелса и закрыл первый раунд финансирования на 1 миллиард долларов

Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).

В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.

Также стал известен официальный список ко-фаундеров⬆️

Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер

Читать полностью…

Data Secrets

Ничего необычного, просто в Китае прямо на улицах устанавливают всем желающим OpenClaw

Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.

Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.

Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.

Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.

Читать полностью…

Data Secrets

Autoresearch от Андрея Карпаты

Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.

Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.

Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себя несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям ⬆️).

Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.

https://github.com/karpathy/autoresearch

Читать полностью…

Data Secrets

Когда в 2023-м все начали говорить про агентов, под этим чаще всего подразумевали цепочку промптов с фиксацией контекста, а про инфраструктуру, как правило, даже не задумывались. Сейчас кто-то по-прежнему считает, что агенты — это окошечки с LLM, а развернутая на единственной ноде модель — это подходящая инфраструктура для агентской системы. На самом деле это, конечно, не так.

Чтобы экономика сходилась и железо утилизировалось эффективно, нужно учитывать реальный паттерн нагрузки: долгие сессии, многошаговые диалоги, большие контексты.

В последнем обновлении Yandex AI Studio интересен не столько факт, что появилась модель DeepSeek V3.2, сколько то, как под нее оптимизировали инференс. Модель работает в режиме prefill/decode, где prefill-ноды оптимизированы под быстрый прогон длинных контекстов, а decode-ноды — под устойчивую генерацию с низким и стабильным показателем Time Between Tokens. Чтобы это работало, пришлось научиться передавать KV-кэши между серверами в реальном времени, а это гигабайты данных.

Дальше — больше. Введена иерархия кэшей (GPU → CPU → распрелеленный слой), а балансировщик теперь «знает», где уже хранятся закешированные фрагменты контекста, и отправляет запрос туда, где cache hit rate будет выше.

Поверх этого слоя появились приватные эндпоинты и правила модерации ответов моделей, что особенно актуально при работе с опенсорс моделями в корпоративном контуре. Добавили и новый подход к тарификации: появились токены инструментов и токены кеширования. Первые участвуют при вызове встроенных инструментов (File Search, Web Search, MCP), вторые — при повторном использовании уже обработанных фрагментов запроса. Всё это стоит в четыре раза дешевле обычных токенов и делает длинные агентские сценарии экономически осмысленными.


Возможно, именно здесь и начинается взрослая эпоха для агентных систем — не промпт-цепочки, а полноценные цифровые организмы, у которых есть память, тело и дисциплина.

Читать полностью…

Data Secrets

Агент Cursor решил одну из задач First Proof challenge лучше, чем люди

First Proof challenge – это набор из 10 математических задач, составленный 11 известными математиками (включая лауреата Филдсовской премии Мартина Хайрера).

Задачи там из областей алгебраической комбинаторики, спектральной теории графов, топологии, стохастического анализа и тд. Они имитируют реальную работу академиков лучших университетов мира.

Задачки были составлены всего лишь месяц назад и открыто не публикуются во избежании лика данных в трейн моделей.

И вот сегодня CEO Cursor заявил, что их агент (для кодинга, на секундочку) справился с одной из этих задач, и нашел при этом лучшее решение, чем люди.

Это подтверждают математики: подход агента действительно отличается от существующего и улучшает доказательство до новой константы.

Что интересно, тут использовалась ровно та же система, с помощью которой Cursor с нуля завайбкодили браузер (пост об этом вот тут). Она автономно работала над задачей четыре дня, не получая никаких подсказок.

П
од капотом там, кстати, не один, а десятки агентов на основе разных моделей, которые динамически планируют действия и работают над подзадачами.

Читать полностью…

Data Secrets

Более 2.5 миллионов человек заявили, что они отменили подписку на ChatGPT из-за последних событий

По крайней мере, такие данные зафиксировал сайт quitgpt.org/. Он был специально создан, чтобы бойкотировать стартап за сделку с Пентагоном.

Сколько из перечисленных 2.5 миллионов подписавших петицию действительно перешли на другой ИИ – неизвестно.

Так или иначе, 2.5 миллиона – это все еще только около 0.3% от еженедельных пользователей бота.

Читать полностью…

Data Secrets

Проект по машинному обучению — всегда больше, чем просто модель

В реальных проектах важно все: сбор и подготовка данных, проектирование пайплайна, интеграция инструментов и технические решения по внедрению. Без понимания этих этапов трудно представить, какие компетенции ожидают от инженера машинного обучения.

На вебинаре «Машинное обучение на практике: соберите бота для расшифровки аудиосообщений» от karpovꓸcourses вы пройдете полный путь построения проекта на конкретном кейсе. Эксперты с индустриальным опытом в ЯндексꓸЕда и из ИТМО покажут, какие навыки действительно требуются инженеру машинного обучения в работе.

Присоединяйтесь к вебинару по ссылке: https://clc.to/erid_2W5zFGW1avm

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFGW1avm

Читать полностью…

Data Secrets

США использовали Claude в недавних боевых операциях в Иране – даже после запрета Трампа

WSJ сообщает, что во время недавних ударов по Ирану Центральное командование США использовало Claude для: разведывательных оценок, идентификации целей и моделирования боевых сценариев.

Формально это, конечно, не прямое нарушение приказа Трампа, потому что у них есть еще 6 месяцев, чтобы отказаться от Claude. И тем не менее, тайминг интересный:

– В пятницу Anthropic отказываются принимать условия Пентагона

– В тот же день Трамп агрессивно призывает все агентства прекратить использовать Claude и называет Anthropic леваками

– Буквально через несколько часов Claude используют для атаки Ирана и, возможно, даже убийства верховного лидера страны

В странное время живем

Читать полностью…

Data Secrets

Доброе утро от создателя YouTube

"Надеюсь все наслаждаются последним годом работы, имеющей смысл"


🍿

Читать полностью…

Data Secrets

Создатель Twitter Джек Дорси уволил половину своей компании Block из-за ИИ

До сегодняшнего дня штат Block (бывшая Square) насчитывал чуть более 10к сотрудников, пока Дорси не решил одним днем уволить 4 тысячи из них.

Он заявил, что руководство приняло такое решение не из-за проблем. Наоборот, бизнес силен, валовая прибыль продолжает расти и так далее. Просто "что-то изменилось".

Мы уже видим, что интеллектуальные инструменты, которые мы создаем и используем, в сочетании с небольшими командами позволяют создать новый способ работы, который коренным образом меняет то, что значит строить и управлять компанией. И это быстро ускоряется.


По словам Дорси, он мог бы сокращать штат постепенно в несколько подходов, но выбрал более честный и жесткий путь.

Самое интересное, что акции компании после этого заявления подскочили на 23% всего за час. В денежном эквиваленте это примерно +6млрд долларов к стоимости компании.

Никакого влияния на рынок труда, говорите?

Читать полностью…
Subscribe to a channel