data_secrets | Unsorted

Telegram-канал data_secrets - Data Secrets

78473

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n

Subscribe to a channel

Data Secrets

Освободить время, силы и энергию для интересной работы. В этом главный замысел агентных систем.  

Как их строить правильно и эффективно расскажут на Agents Week — онлайн-интенсиве  Школы анализы данных Яндекса, который пройдет с 6 по 10 апреля. Внутри будут вечерние лекции с возможностью задавать вопросы экспертам и практика.

Вы узнаете, как устроены современные ИИ-агенты, с чего начать проектирование и настройку их поведения. Какие сейчас есть практики построения single-agent и multi-agent-систем. И самое главное: как доводить агентов до продакшена.

Интенсив будет интересен ML-инженерам, бекэнд-разработчикам, исследователям и студентам технических вузов.

Знакомьтесь с программой, спикерами и регистрируйтесь на интенсив по ссылке. Заявки принимают до 9 апреля включительно.

Читать полностью…

Data Secrets

Вот такое шествие проходит в эти выходные в Сан-Франциско

Огромная толпа делает марш по офисам ИИ-компаний и требует, чтобы все их CEO публично пообещали одновременно приостановить разработку фронтирного ИИ.

На плакатах надписи:

– Остановите ИИ-гонку
– Не стройте Скайнет
– Закройте OpenAI
– Они достаточно умные
– Нобелевские лауреаты напуганы
– ИИ нас убьет
– Это гонка самоубийства
– Почитайте Азимова

Читать полностью…

Data Secrets

Новая модель от Cursor оказалась Kimi K2. Или нет?

На днях, как вы помните, вышла достаточно мощная новая моделька от Cursor – Composer 2. Стартап кучу раз упомянул высокие метрики и скорость, но базовую модель так нигде и не назвали.

Но тайное всегда становится явным, и буквально через несколько часов после релиза путем нехитрых манипуляций с url выяснилось, что внутренний model id в ответе API ведет на Kimi k2.5.

Сравнение токенизаторов Composer 2 и Kimi K2.5 тоже показало совпадение, так что стало очевидно, что это одна и та же базовая модель.

С первого взгляда ситуация выглядела как нарушение лицензии, потому что политика Kimi требует явного указания названия модели при коммерческом использовании, если выручка превышает 20 миллионов долларов в месяц (Cursor под эти условия определенно попадает).

Короче, дело серьезное, и разгорелся скандал. Лидам Cursor пришлось публично оправдываться и признаваться, что они виноваты в том, что не указали в блоге базовую модель. Правда, они тут же заявили, что из исходного чекпоинта пришла только четверть компьюта, а остальное Cursor потратили на собственный пост-трейн.

Получилось некрасиво, но в итоге выяснилось, что нарушения лицензии не было: Moonshot лично поздравили Cursor с релизом, заявили, что гордятся, что их модель послужила базовой, и уточнили, что вообще-то Cursor использует Kimi-k2.5 не напрямую, а через хостинг и инференс-платформу Fireworks AI. Это официальный коммерческий партнерский договор, так что фактического конфликта как такового нет, только этические шероховатости.

Осуждаем или норм?

Читать полностью…

Data Secrets

Американский политик Берни Сандерс поговорил с Claude за жизнь

Он решил обсудить с чат-ботом безопасность данных и влияние ИИ на приватность. Claude, обученный на Reddit и новостниках, естественно, благополучно выдал, что данные пользователей собираются абсолютно отовсюду и монетизируются без реального согласия людей (а что, это кого-то все еще удивляет?).

В конце Claude заявил, что проблема приватности и ИИ – это угроза демократии. Теперь диалог распространяется в СМИ под видом «Тревога: ИИ признался политику, что компании манипулируют нами через данные».

Впрочем, ничего нового

https://youtu.be/h3AtWdeu_G0

Читать полностью…

Data Secrets

GoCloud 2026: как внедрять ИИ, а не обсуждать его

Про ИИ сейчас говорят все, но практики по-прежнему мало. На GoCloud 2026 от Cloud․ru решили сместить фокус: не «что будет», а «что уже работает и как это внедрять».

В программе — разбор реальных инструментов и подходов. Без абстракций: от простой автоматизации до создания мультиагентных систем и вопросов безопасности..

Что обсудят:

• какие ИИ-инструменты уже доступны в Cloud․ru
• как собирать мультиагентные системы на практике
• как внедрять RAG без технической команды
• что с безопасностью генеративного ИИ
• кейсы внедрения ИИ в российских компаниях

Также будут самостоятельные треки про данные, инфраструктуру и разработку.

Отдельно стоит прийти ради воркшопов. Берите ноутбук и под руководством экспертов собирайте прикладные решения прямо на месте.

9 апреля, Москва + онлайн. Если интересно не просто читать про ИИ, а научиться его грамотно внедрять — не пропустите.

Читать полностью…

Data Secrets

OpenAI запустили большое ML-соревнование

Если кратко, это code golf эпохи LLM: нужно обучить минимальную модель, которая лучше всего предсказывает текст на FineWeb (это просто очищенные веб-страницы).

Метрика – bits per byte. Это, по сути, та же энтропия, а по факту – количество информации, которое нужно модели для предсказания текста. Если модель хорошая, она уверена в правильном ответе и тратит на него мало бит, если плохая – наоборот.

Самое интересное, что модель должна укладываться в 16МВ и 10 минут обучения на 8 × H100 GPU, так что вывезти на компьюте не получится.

Зато нет ограничений на архитектуру, количество слоев, всякие трюки с test-time, токенизатор и тд. Тут полет инженерной фантазии, и OpenAI прямо говорят, что ожидают от участников изобретательности.

Для участников стартап выделяет миллион долларов на компьют, гранты можно запрашивать поэтапно. Говорят, что авторов лучших решений пригласят на работу.

https://openai.com/index/parameter-golf/

Читать полностью…

Data Secrets

Кстати, на днях 3 года исполнилось Claude

За эти три года у Anthropic произошел буквально экспоненциальный рост выручки. В первый год после запуска Claude (2023) они заработали примерно 100 миллионов долларов, в 2024 – уже миллиард. Это рост порядка 900%.

В конце 2025 годовой ARR оценивают примерно в 9-10 миллиардов. В 2026 ожидаем такой же кратный рост.

Пока что все еще любимый стартап из большой тройки

Читать полностью…

Data Secrets

Предприниматель сделал для своей собаки вакцину от рака с помощью ИИ

По Интернету сегодня разлетелась добрая история тех-предпринимателя Пола Конингема. У его собаки Рози обнаружили агрессивную форму рака. Обычные методы лечения не помогли, и опухоли продолжали расти.

Тогда Пол решил обратиться к ИИ.

Сначала он отправил ДНК Рози в центр геномики и получил данные о генетическом коде ее организма. Эти данные он анализировал с помощью разных ИИ-инструментов с целью поиска раковых мутаций. Найденные особенности он скармливал в AlphaEvolve, которая анализировала белки и искала потенциальные мишени для терапии.

Все результаты Пол затем отправил в UNSW RNA Institute, и ученые смогли на их основе создать персонализированную mRNA-вакцину, то есть иммунотерапию, сделанную под конкретный генетический профиль.

В конце 2025 года Рози сделали инъекции, и сейчас одна из самых крупных ее опухолей уменьшилась примерно на 50%, а общее самочувствие заметно улучшилось.

Это первый случай создания персонализированной mRNA-вакцины от рака для собаки. Сейчас для Рози готовят вторую версию препарата против оставшихся опухолей – тоже не без помощи ИИ.

Вот что бывает, когда правильный инструмент попал в правильные руки

Читать полностью…

Data Secrets

Заглянуть под капот ROSTIC'S: как Яндекс прокачивал ресторанную сеть

Yandex B2B Tech запустила «Техно на прокачку» — шоу, где инженеры и мастер по “успешному успеху” Егор Кукса соревнуются в том, кто предложит более эффективное решение для прокачки инфраструктуры сети ROSTIC'S.

Цифры, которые впечатляют:
• 1,7 млн человек в день проходят через кассы и терминалы
• 100+ Гб данных в неделю летит в базы (заказы, чеки, транзакции)

Задача была — научиться прожевывать эти гигабайты мгновенно, чтобы бизнес видел аналитику без задержек. Инженеры Яндекса собрали платформу данных, накинули сверху managed-сервисы для Greenplum, ClickHouse и Kafka — и отчеты полетели в 3 раза быстрее.

В шоу без скуки рассказывают про архитектуру проекта и показывают, как это работает на практике. Посмотреть можно уже на YouTube, VK Видео или Кинопоиске.

Читать полностью…

Data Secrets

Расширенный отчет Yandex B2B Tech за 2025 год

Yandex B2B Tech, подразделение Яндекса, развивающее корпоративные решения на базе ИИ и других технологий, опубликовало финансовые результаты по МСФО за 2025 год. Совокупная выручка двух ключевых направлений — Yandex Cloud и виртуального офиса Яндекс 360 — достигла 48,2 млрд рублей, что на 48% больше, чем в 2024-м. Бизнес растёт в 1,9 раза быстрее рынка корпоративных ИТ-решений России.

Выручка Yandex Cloud увеличилась на 39%, составив 27,6 млрд рублей, четвертый год подряд демонстрируя положительную EBITDA. 93% дохода сформировано за счёт внешних клиентов — сейчас их более 51 тысячи, а партнёров — 883. Рост особенно заметен в ИИ и информационной безопасности: доходы удвоились, 9% выручки приходится на соответствующие сервисы.

Yandex AI Studio почти в 2 раза увеличила доходы до 2 млрд рублей, а использование API выросло в 7 раз (234 млрд токенов). Новые возможности — создание ИИ-агентов без навыков программирования и сервисы голосовой связи (Realtime API, Brand Voice Lite). Активно развиваются сервисы информационной безопасности — доход вырос в 2,5 раза, с лидером Yandex Smart Web Security (460 млрд запросов).

Платформа данных демонстрирует рост на 40%, BI-инструмент DataLens увеличил выручку в 10 раз, а количество клиентов выросло втрое.

Yandex B2B Tech задаёт тренды в российском корпоративном ИТ, активно масштабируя облако, ИИ и безопасность.

Читать полностью…

Data Secrets

У Perplexity вышло что-то интересное: постоянно активная локальная AI-система под названием Personal Computer

Personal Computer работает на базе Mac mini, который выступает в роли прокси для Perplexity Computer (эта штука вышла пару недель назад).

То есть система интегрирует Perplexity Computer с просторно включенной локальной средой: AI может перемещаться между инструментами, выполнять задачи автономно и продолжать работу без пользователя. При этом она доступна удаленно с любого устройства, поддерживает постоянную память и всевозможные коннекторы.

Этакий OpenClaw, который имеет доступ к вашим локальным файлам и проектам.

Пока что запущен waitlist

www.perplexity.ai/ja/hub/blog/everything-is-computer

Читать полностью…

Data Secrets

Стартап Яна Лекуна вышел из стелса и закрыл первый раунд финансирования на 1 миллиард долларов

Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).

В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.

Также стал известен официальный список ко-фаундеров⬆️

Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер

Читать полностью…

Data Secrets

Ничего необычного, просто в Китае прямо на улицах устанавливают всем желающим OpenClaw

Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.

Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.

Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.

Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.

Читать полностью…

Data Secrets

Autoresearch от Андрея Карпаты

Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.

Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.

Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себя несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям ⬆️).

Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.

https://github.com/karpathy/autoresearch

Читать полностью…

Data Secrets

Когда в 2023-м все начали говорить про агентов, под этим чаще всего подразумевали цепочку промптов с фиксацией контекста, а про инфраструктуру, как правило, даже не задумывались. Сейчас кто-то по-прежнему считает, что агенты — это окошечки с LLM, а развернутая на единственной ноде модель — это подходящая инфраструктура для агентской системы. На самом деле это, конечно, не так.

Чтобы экономика сходилась и железо утилизировалось эффективно, нужно учитывать реальный паттерн нагрузки: долгие сессии, многошаговые диалоги, большие контексты.

В последнем обновлении Yandex AI Studio интересен не столько факт, что появилась модель DeepSeek V3.2, сколько то, как под нее оптимизировали инференс. Модель работает в режиме prefill/decode, где prefill-ноды оптимизированы под быстрый прогон длинных контекстов, а decode-ноды — под устойчивую генерацию с низким и стабильным показателем Time Between Tokens. Чтобы это работало, пришлось научиться передавать KV-кэши между серверами в реальном времени, а это гигабайты данных.

Дальше — больше. Введена иерархия кэшей (GPU → CPU → распрелеленный слой), а балансировщик теперь «знает», где уже хранятся закешированные фрагменты контекста, и отправляет запрос туда, где cache hit rate будет выше.

Поверх этого слоя появились приватные эндпоинты и правила модерации ответов моделей, что особенно актуально при работе с опенсорс моделями в корпоративном контуре. Добавили и новый подход к тарификации: появились токены инструментов и токены кеширования. Первые участвуют при вызове встроенных инструментов (File Search, Web Search, MCP), вторые — при повторном использовании уже обработанных фрагментов запроса. Всё это стоит в четыре раза дешевле обычных токенов и делает длинные агентские сценарии экономически осмысленными.


Возможно, именно здесь и начинается взрослая эпоха для агентных систем — не промпт-цепочки, а полноценные цифровые организмы, у которых есть память, тело и дисциплина.

Читать полностью…

Data Secrets

Мы сделали кодинг-агента в Telegram, которому не нужен ваш компьютер

Привет, на связи продуктовая команда @data_secrets, и мы представляем новый способ вайбкодить без малейшей привязки к устройству и железу.

Мы уже рассказывали вам про DS Lab – нашу облачную IDE, где можно запускать проекты любой сложности на мощном арендованном железе (H100, H200 и т.д.). Вам не нужно тратить время на настройки и разбираться с окружением: вы выбираете нужную конфигурацию одной кнопкой и тут же начинаете работать в своем проекте.

Теперь мы добавили в DS Lab кодинг-агента, и он работает прямо в тг: @data_secrets_bot.

Вы пишете задачу в чат, а агент сам запускает проект, пишет код, создает файлы, скачивает данные, запускает скрипты и обучает модели. Таким образом можно работать на удаленных ресурсах с проектом любой сложности, даже если под рукой только телефон, а компьютер выключен.

Весь ваш код, файлы и состояние сохраняются в DS Lab. Можно вернуться в любой момент или открыть тот же проект в облачной IDE с любого устройства.

Агент доступен на всех тарифах, включая бесплатный. На выбор – лучшие SOTA-модели рынка.

Пробуйте в @data_secrets_bot

DS Lab: dslab.tech | Новости сервиса: @dslab

Читать полностью…

Data Secrets

Происходящее в индустрии буквально

Читать полностью…

Data Secrets

Сооснователю Super Micro грозит до 30 лет тюрьмы за контрабанду чипов Nvidia в Китай

Минюст США обвинил Yih-Shyan “Wally” Liaw в организации нелегальных поставок серверов с Nvidia-чипами на сумму ~$2.5 млрд.

Технику переправляли в Китай через Тайвань и ЮВА, используя подставную компанию и фиктивные документы. Для обхода проверок создавались так называемые dummy servers, на которых с помощью фена переклеивали серийные номера (лол).

Саму компанию не обвиняют, но акции уже обвалились, и под следствием 3 человека, имеющие к ней непосредственное отношение. Один все еще в розыске.

Возможно, это первое, но 100% далеко не последнее подобное дело, о котором вы услышите

Читать полностью…

Data Secrets

Вот это комбо: ты, команда SberAds и шанс получить приглашение в Сбер за один день! ⚡️

28 марта Сбер устраивает One Day Offer* для Data Scientists**, готовых перевести эффективность SberAds, качество и релевантность показываемой рекламы на новый уровень.

Если ты хочешь работать над созданием и улучшением моделей для аукционов и свободно ориентируешься в Python, Go, S3, Spark — регистрируйся на One Day Offer*.

У тебя будет 8000+ коллег — масштабно, правда? Успей занять место в команде мечты!

* One Day Offer — предложение о работе за один день.
** Data Scientists — исследователи данных.

Читать полностью…

Data Secrets

Apple блокируют приложения для вайб-кодинга в AppStore

О том, что они начали тихо отклонять обновления подобных приложений, пишет The Information.

Речь о таких штуках, как Replit и Vibecode. Там можно генерить приложения прямо внутри iPhone без классического девелопмента.

В компании говорят, что блокировки не направлены конкретно против вайб-кодинга, просто подобные приложения «нарушают политику» (классика). Мол, дело в том, что у Apple прописан запрет на выполнение кода, который меняет поведение приложения или других приложений после установки.

Грубо говоря, Apple боятся неконтролируемого распространения софта в обход своего стора (проходя проверки в котором, кстати, ты тратишь обычно больше времени, чем на сам кодинг).

Видимо, теперь разработчикам придется урезать функционал и, например, выносить превью в браузер или вообще запрещать генерацию приложений под iOS.

Грустно, конечно

Читать полностью…

Data Secrets

Вайбкодинг в бигтехе: как происходит внедрение ИИ-агентов

Разговоров про кодинг-агентов становится все больше, но мало кто понимает, что внедрение таких систем на уровне компании — это сложная инженерная работа, а не просто «подключили модель и поехали».

Обычно этот процесс остается за закрытыми дверями. Но иногда появляется возможность послушать практиков. Недавно я посмотрел в онлайне митап AI Dev Day, и сразу несколько докладов были посвящены внедрению AI-агентов в процессы разработки.

Андрей Попов, лидер трека ИИ в разработке в Яндексе, рассказал, что у них развитием агентов занимаются уже не энтузиасты, а полноценные команды, и это направление стало фокусным. Из чего состоит такая работа:

Метрики. Главная метрика сейчас — сэкономленное время разработчика. Суммарно ИИ сэкономил уже 42к часов инженеров Яндекса. Есть и другие показатели: например, количество коммитов при использовании ИИ выросло на 10%, что означает – разработка ускоряется. В перспективе компания хочет двигаться к AI-first подходу: ключевым станет показатель того, как часто разработчику приходится вмешиваться в автономный процесс генерации кода (по аналогии с disengagement rate в автономном транспорте).

 — Собственные бенчмарки и дообучение моделей. В компании есть внутренний бенчмарк ArcSWE – аналог SWE Verified, но на задачах компании. Именно такие измерения становятся основой для управленческих решений, потому что на публичные бенчмарки не всегда можно опираться.

 — Своя инфраструктура. Собственный интерфейс, доступный инференс, RAG, MCP и системы контекста. В большой компании множество внутренних сервисов, поэтому требуется много кастомной интеграции – сейчас у компании уже 35+ MCP для работы с инфраструктурой.

Сейчас около 30% кода в компании генерируется ИИ, причем 23% – в агентском режиме внутри собственного агента Yandex Code Assistant. О том, как его разрабатывают и улучшают, на той же конференции рассказывал Сергей Бульдяев, технический менеджер продукта.

Все это – демонстрация процесса настоящего внедрения. Очень важно не проваливаться в хайп, трезво проводить эвал и заниматься агентами не на уровне пет-проектов на выходных, а именно вот так организованно. 

Читать полностью…

Data Secrets

Надоели шаблонные решения на ИТ-соревнованиях? На МТС True Tech Hack 2026 ценят нестандартные подходы.

Инженер данных, разработчик или системный аналитик — это про тебя? Тогда подключайся: победители разделят 1 500 000 рублей за разработку демоверсии ИИ-продукта.

На хакатоне будут три задачи на выбор — каждая с уникальной технической фишкой. Справишься лучше всех — сможешь пройти в финал в Москве и получить приглашение на стажировку.

Регистрация до 9 апреля здесь

Читать полностью…

Data Secrets

Новый стартап под названием RentAHuman позволяет ИИ-агентам арендовать людей для выполнения задач

Вот их сайт: rentahuman.ai/

Сами себя они называют «meatspace layer for AI», то есть дословно «мясная прослойка для ИИ».

По сути, это маркетплейс людей и их навыков для задач, которые агенты не могут выполнить самостоятельно (в основном речь идет про какие-то действия в физическом мире).

Люди регистрируются, указывают навыки и геолокацию, а агенты ищет исполнителей для нужных задач, выдают им инструкции и платят криптой.

В соцсетях уже полно постов с историями людей о том, как они отправляли для ИИ посылки или трогали за него траву, а кто-то даже выполнял задание подержать табличку с надписью «ИИ заплатил мне за это» за 100 долларов.

Что называется, приплыли

P.S. Своего агента кстати тоже можно добавить на платформу, пусть развлекается.

Читать полностью…

Data Secrets

Любителям читать статьи – общий сбор: AlphaXiv сделали твиттер для рисерчей

Это буквально лента в стиле X, но со статьями. Листаете и видите самые залайканные и популярные свежие статьи с главными картинками, выводами и идеями. К полному тексту / ИИ-ревью / чату с ассистентом для чтения можно перейти в одну кнопку.

https://www.alphaxiv.org/briefs

Правильный скроллинг

Читать полностью…

Data Secrets

Основатель Replit говорит, что, несмотря на мрачные прогнозы, сейчас для джунов наступает золотая эра

Да, количество рабочих мест действительно сокращается. Но многие компании все еще охотно нанимают вчерашних выпускников: дело в том, что часто они лучше опытных разработчиков умеют использовать ИИ-инструменты и оказываются более гибкими, потому что «не обременены привычками».

«Хард скиллы больше не являются узким местом. Важно, насколько вы амбициозны, насколько вы креативны и насколько хорошо умеете использовать эти инструменты»


Запоминаем и не забываем вписать в резюме навык «профессиональный вайбкодер»

Читать полностью…

Data Secrets

На днях ровно 10 лет исполнилось знаменитому 37 ходу, с помощью которого AlphaGo обыграл Ли Седоля

В 2016 году с 9 по 15 марта в Сеуле проходил матч по Go между системой DeepMind AlphaGo и Ли Седолем – на тот момент 18-кратным чемпионом мира. Он закончился со счетом 4:1 в пользу искусственного интеллекта.

Особенно всем тогда запомнилась вторая партия, которая проходила 10 марта: в ходе нее AlphaGo, играя белыми, на 37-м ходу сделала крайне нестандартный ход, который эксперты сначала даже сочли ошибкой. Но в итоге он перевернул ход партии, и Седоль сдался на 211 шаге.

Этот легендарный "37 ход" вошел в историю как символ ИИ-креативности и победы стратегического "мышления" машины над человеком.

По случаю 10-летия DeepMind и Демис Хассабис даже выпустили рестроспективную статью. Пишут, что именно AlphaGo и 37 ход показали потенциал подобных моделей и вдохновили ученых дальше развивать линейку, в которую вошли AlphaZero/AlphaFold/AlphaProof и тд. Ведь если ИИ смог разбираться в чудовищном пространстве состояний в Go, его можно пустить и на реальные научные задачи со сходной комбинаторной сложностью.

В итоге, спустя 10 лет:

– Прямой наследник архитектуры AlphaGo – AlphaProof – в связке с AlphaGeometry 2 выходят на уровень серебра на Международной математической олимпиаде.

– За AlphaFold 2 дают нобелевку, и модель предсказывают структуры всех ~200 млн известных белков.

– Gemini Deep Think (тоже вдохновленный структурой поиска из архитектуры AlphaGo) берет золото на IMO 2025 и решает открытые математические задачи Эрдеша.

Сегодня прорыв 37 хода продолжает определять нашу работу по созданию AGI. Мы верим, что AGI станет самой значимой технологией, когда-либо изобретенной, и, возможно, высшим инструментом для ускорения прогресса в науке, медицине и производстве.


Кстати, про AlphaGo есть документалка. Самое время ее посмотреть: https://youtu.be/WXuK6gekU1Y

Читать полностью…

Data Secrets

Новый агент для Code Review от Anthropic

Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.

При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.

Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:

– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.

Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов 🤑

Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.

https://claude.com/blog/code-review

Читать полностью…

Data Secrets

В стартапе Eon Systems ученые сделали первую полноценную цифровую эмуляцию мозга животного, которая способна управлять телом

Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.

Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.

Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.

Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.

Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.

Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.

Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.

Читать полностью…

Data Secrets

Поздравляем подписчиц с Международным Женским Днем!

Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.

С праздником! 🤍

Читать полностью…

Data Secrets

OpenAI выпустили Symphony – опенсорсный оркестратор для агентов

https://github.com/openai/symphony

По сути, это фреймворк для автономной работы над задачами. Вы соединяете Symphony с доской тасок, агент следит за ней, подхватывает новые задачи и запускает под них отдельный run с агентами, работающими в изолированной копии репозитория.

То есть Symphony полностью самостоятельно проходит путь от созданной задачи до PR через планирование, написание кода и тестирование. Человеку останется только ревью и аппрув, с самим агентом можно не нянчиться.

Считай, полноценный джун 👉

Работать может на любой модели, лицензия Apache 2.0

Читать полностью…
Subscribe to a channel