90398
Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n
OpenRouter выпустили API для запуска ансамблей моделей
По сути, это попытка превратить ручную сборку консенсуса моделей в готовый продукт из коробки, и весьма удачная. Работает так:
1. Вы отправляете один запрос в openrouter/fusion, и OpenRouter на своей стороне запускает панель из нескольких моделей, которые отвечают независимо друг от друга.
2. Затем еще одна модель-судья анализирует результаты и выдает на их основе финальный ответ.
3. Стек самих моделей по умолчанию выглядит как (~anthropic/claude-opus-latest, ~openai/gpt-latest, ~google/gemini-pro-latest), а судья – по дефолту первая из них, то есть claude-opus-latest. Также стек моделей и судью можно задать самостоятельно.
То есть, если выбирать модели по умолчанию, Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели. Есть смысл использовать только для очень сложных задач (буст в качестве действительно заметный, если что).
Но с другой стороны, благодаря возможности задать стек самому, это может быть и неплохой способ сэкономить. Например, OpenRouter пишут, что стек (Gemini 3 Flash, Kimi K2.6, and DeepSeek V4 Pro) превосходит соло запуски GPT-5.5 и Opus 4.8, и оказывается примерно в 1% от результатов Fable 5, а стоимость примерно вдвое ниже. Так что пробуем.
Еще из интересного: фича может работать как тул. То есть можно добавить {"type": "openrouter:fusion"} к вызову обычной модели, и она сможет сама как бы обратиться к совету других моделей, когда посчитает нужным.
Документация
Мем: в числе прочих доступа к Mythos лишили Андрея Карпаты, который недавно ушел работать в Anthropic R&D
Дело в том, что он не гражданин США.
Лицо исследователя без доступа к объекту исследования представили?
OpenAI рассматривает серьезное снижение цен на API, чтобы отбить пользователей у Anthropic
По словам WSJ, решение пока не принято, но OpenAI думает о снижении цен заранее, потому что ожидает, что Anthropic может тоже пойти на демпинг. Речь не о подписках, а именно о ценах на токены, потому что сражаются стартапы в первую очередь за энтерпрайз.
Борьба за рынок перед IPO наращивает обороты. Нам такое на руку 😎
Что мешает внедрению AI в бизнесе
Внедрение AI в бизнес-процессы упирается не только в модели и железо. Часто проблема в качестве, структуре и смысле данных. А еще — в знаниях сотрудников, которые не описаны в системах, но критичны для результата.
➡️ 25 июня HFLabs проведет митап о том, что на самом деле тормозит внедрение AI в больших компаниях.
О чем пойдет речь?
— какие данные нужны AI, чтобы он стал рабочим инструментом;
— почему без качественных данных нейросети не дают результата, которого ждет бизнес;
— как извлекать знания из сотрудников и превращать их в систему;
— как внутренние данные, контексты и жаргон ломают красивые демо.
Спикеры — те, кто такие проекты реализует:
— Николай Трошнев, директор управления корпоративных данных, «Ситилинк»;
— Федор Лежнев, директор департамента информационных технологий, «Альфа-Капитал»;
— и другие.
Митап пройдет без записи, в камерной атмосфере — так разговор честнее.
Кому будет полезно?
CDO, CIO, CTO, архитекторам данных, руководителям data- и AI-направлений и бизнесу, который хочет понять, что стоит за внедрением AI на практике.
📍25 июня, 19:00
Офис HFLabs, г. Москва, рядом с метро «Парк культуры»
Перед началом — фуршет, после — нетворкинг.
Митап бесплатный. Для участия зарегистрируйтесь и дождитесь подтверждения.
Anthropic выпустят модель класса Mythos. Возможно, уже сегодня.
The Information пишет, что модель под (кодовым?) названием Fable будет первой публичной версией Mythos.
Она будет в три раза дороже Opus. Но дешевле, чем сам Mythos, и на том спасибо.
Ждем ждем ждем
Один из корпоративных клиентов Anthropic случайно потратил за месяц 500 миллионов долларов на токены
Вы не ослышались, пол миллиарда долларов.
Об этом изданию Axios рассказал консультант компании (сама компания не называлась). Дело в том, что для сотрудников не были установлены лимиты по использованию, и те сожгли дополнительных токенов буквально на миллионы.
Теперь понятно, откуда у Anthropic такой ARR
Яндекс выпустил Alice AI LLM Flash для бизнеса
Новая языковая модель Alice AI LLM для B2B сегмента оптимизирована под задачи, связанные с обработкой текстов и документов: модерацию контента, техподдержку, поиск по базам знаний и работу с массовыми запросами.
Что известно о модели:
– Она позволяет решать типовые b2b-задачи почти в 5 раз дешевле по сравнению с предыдущими решениями Яндекса;
– По данным компании, в 56% бизнес-сценариев модель показывает результаты лучше, чем GPT-5.4 mini;
– Отдельно отмечаются хорошие результаты в диалогах, структуризации текста и поиске информации по документам;
– Модель ориентирована на high-load сценарии, где важны скорость ответа и низкая стоимость обработки;
– Модель уже доступна бизнесу на платформе Yandex AI Studio.
Кроме того, компания также открыла доступ к DeepSeek V4 Flash — первой доступной в России облачной модели с контекстным окном в 1 млн токенов. Её предлагают использовать для ИИ-агентов, анализа больших документов и сложных многоэтапных задач.
Яндекс Образование и Томский политех собирают студентов на офлайн-студкемп по компьютерному зрению
Две недели на базе ТПУ, с 10 по 23 августа. Очень много практики, нетворка и лекций от инженеров Яндекса, исследователей университета. Разберетесь с современным стеком CV, будете решать задачи на реальных исследовательских данных и работать над собственным проектом.
Всем, кто пройдет отбор, Яндекс Образование оплатит проезд и проживание. Для тестового пригодятся Python, базовые библиотеки numpy, pandas, PyTorch и OpenCV, понимание линейной алгебры, теории вероятностей и матстата.
Заявки принимают до 14 июня — успевайте зарегистрироваться по ссылке.
Microsoft запретят сотрудникам использовать Claude Code, потому что не тянут косты
В декабре компания заключила сделку с Anthropic и активно призывала своих инженеров использовать Claude Code. Долго уговаривать сотрудников, видимо, не пришлось, и инструмент быстро стал популярным.
Возможно, даже слишком популярным. Потому что теперь Microsoft объявили, что планируют аннулировать свою лицензию и перейти на Copilot CLI. В частности, разработчиков всех основных продуктов компании (включая Windows, Microsoft 365, Outlook и тд) попросили перенести все данные из Claude до конца июня.
А вы думали, ИИ будет удешевлять процессы? Ну-ну 😵
DeepSeek тотально снизили цены на модель DeepSeek‑V4‑Pro
Удешевление составило около 75% на вход и до 90% на выходные токены. По новым ценам вы получаете миллион токенов за 0.43 $ за вход и 0.87 $ за выход. С кэшем – еще дешевле.
Напоминаем, что по метрикам эта модель примерно на уровне Gemini 3.1 Pro, но теперь она в 4-7 раз дешевле всех фронтиров.
Подарок
Сэм Альтман предложил каждому стартапу в YCombinator 2 миллиона долларов в токенах за долю в компании
Скорее всего, рассчитывать на такую щедрость (aka почти безлимитный Codex) можно будет примерно за 7% акций: около того обычно берет сам YCombinator.
Но, очевидно, акции стартапов для Альтмана не главное. В первую очередь он хочет повысить популярность Codex и привязать молодые компании к своей экосистеме. Ведь у кого энтерпрайз – тот и победил, а конкурировать за этот рынок с Anthropic не так уж и просто.
«Мне любопытно посмотреть, что будет с tokenmaxxing стартапами: как они будут работать внутри и какие продукты смогут создать» – написал Альтман.Читать полностью…
1.3 миллиона долларов в месяц
Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.
Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.
Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.
Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.
Люди в шоке от наших расходов на AI. Но никто не видит главного: одна из причин, почему меня так вдохновляет работа над OpenClaw – мы пытаемся ответить на вопрос: как будет выглядеть разработка софта в будущем, если стоимость токенов перестанет иметь значение?Читать полностью…
Claude помог пользователю восстановить доступ к кошельку с 5 биткоинами, который был недоступен 3 года
Сумма на счете оценивается примерно в 400 тысяч долларов. Когда-то давно владелец потерял к нему доступ из-за ошибки в хранении файла с паролем.
Агент нашел в недрах старого компьютера юзера нужный файл, обнаружил ошибку в btcrecover, исправил ее и расшифровал пароль.
История разлетелась на миллионы просмотров, а парень теперь обещает назвать своих детей в честь Дарио Амодеи
Anthropic 🤝 SpaceX
Компании Дарио Амодеи и Илона Маска только что объявили о крупном партнерстве.
SpaceXAI предоставит Anthropic доступ ко всей вычислительной мощности дата-центра Colossus 1 в Мемфисе. Это примерно 300 мегаватт вычислительных мощностей или 220к GPU.
Это одна из крупнейших инфраструктурных договоренностей в секторе на данный момент.
В честь закрытия сделки Anthropic уже: удвоили 5-часовые лимиты для платных подписок; полностью убрали сокращение лимитов в пиковые часы (ура!); и повысили лимиты на Opus в API, включая RPM, TPM и квоты. Дальше обещают больше.
Сумма сделки не разглашается.
Калистеника от Boston Dynamics
Новое вирусное видео Atlas они выложили с подписью:
Балансировать коммерческие цели и исследования в робототехнике непросто, но с Atlas мы заставляем это работать.
Пошел слух, что за блокировкой Fable стоит Amazon
По версии сразу нескольких изданий именно CEO Amazon Энди Джесси изначально спровоцировал шатдаун модели.
Все началось с обычного внутреннего исследования, в ходе которого рисерчеры Amazon обнаружили какой-то джейлбрейк, который позволял вытащить из Fable информацию, которая «могла бы оказаться полезной в кибератаках».
Исследователи сделали репорт, и Джесси понес его… нет, не в Anthropic, в который Amazon вложили более 8 миллиардов, а американским чиновникам. Ну и – пошло поехало.
Косвенным образом историю подтверждают слова Дэвида Сакса, председателя Совета консультантов президента США по науке и технологиям.
Он заявил, что некий «доверенный партнер» сообщил администрации о возможности опасного джейлбрейка, после чего правительство якобы попросило компанию устранить риск. По этой версии, Anthropic не согласились с тем, что кейс действительно демонстрирует опасность модели, ну а дальше вы знаете.
Илон Маск стал первым в мире триллионером благодаря IPO SpaceX
IPO состоялось вчера. Цена за акцию составляла 135$, и компании удалось привлечь примерно $75 миллиардов.
Во-первых, это крупнейшее IPO в истории США. Спрос на акции был просто огромный.
Во-вторых, учитывая долю Маска в SpaceX, теперь его состояние оценивается в 1.1 триллион долларов. Чтобы потратить такое состояние за человеческую жизнь (если бы это была наличка, а не бумаги, ха), пришлось бы тратить примерно 13 миллиардов долларов в день.
Скромно.
AI-рисерчеры настолько зашеймили Anthropic за скрытые ограничения Fable, что стартап поменял политику менее, чем за 48 часов после релиза
После выхода модели на ИИ-полях разгорелся настоящий скандал. Если помните, то Anthropic прямо заявляли, что будут открыто переадресовывать запросы, связанные с химией/биологией/кибезбезом на Opus 4.8, сообщая об этом пользователю.
Тут никаких претензий. Но оказалось, что помимо прочего был еще "мелкий шрифт". В системной карте невзначай было написано, что запросы, которые будут засчитаны за попытки дистилляции, будут обрабатываться путем прямого изменения и ухудшения ответов модели. Молча.
На практике же оказалось, что правило касается не только дистилляции, но и в целом почти любой ИИ-разработки. То есть дело обстояло так: инженеры не получали никаких сообщений о срабатывании guardrail, не могли понять, что им урезают возможности и просто получали подпорченные ответы.
Вскрылось все довольно быстро, и возмущению не было предела. Поведение стартапа назвали скрытым саботажем, и дошло до того, что Anthropic публично извинились и заявили, что меняют политику. Теперь, если запрос выглядит как "попытка разработки сильного ИИ", система будет явно сообщать об отказе или переводе запроса на более слабую модель.
Исходную политику Anthropic оправдали тем, что "пытались снизить риск того, что очень сильные возможности модели будут разнесены дальше и станут доступнее для злоумышленников" и сказали, что просто "выбрали неправильный трейд-офф".
Claude Fable во время обучения изобрел собственный язык
Системную карту этой модели можно читать вечно, ощущается немного как научная фантастика. Смотрите, что обнаружили ⬆️
Во время обучения с подкреплением на некоторых долгих rollout сессиях модель внезапно начинала использовать нечитаемый для человека внутренний стиль: странный жаргон, необычную пунктуацию, эмодзи и похожие шаблоны.
При этом непосредственно перед вызовом инструмента или ответом человеку она обычно переключалась обратно на более нормальный английский регистр.
Исследователи не обнаружили никаких признаков того, что модель делала это чтобы специально скрыть свой ризонинг. Скорее, это каким-то образом возникшая внутренняя оптимизация для сжатия рассуждений.
Тем не менее, это наталкивает на воспоминания о дискуссиях на тему так называемого Neuralese – внутреннего языка машин, который человек не сможет читать напрямую. Если модели перестанут рассуждать на естественном языке, то это, естественно, приведет к частичной потере наблюдаемости. И, исходя из находки Anthropic, такой сценарий уже не кажется чем-то сказочным.
Альтман и ведущий ученый OpenAI Якуб Пахоцки опубликовали пост про будущее стартапа
Они считают, что мир входит в новую технологическую эпоху, сравнимую по масштабу с массовым распространением электричества.
Ценность ИИ заключается не в самой технологии, а в том, какие возможности она даст людям: от образования и медицины до предпринимательства и научных открытий.
Мы считаем, что к марту 2028 года значительная часть наших исследований может выполняться ИИ-системами совместно с нашими учеными. Для достаточного прогресса в области элаймента нам потребуется, чтобы ИИ работал вместе с нами. Это поможет пройти переход к миру после появления AGI.
Ведущий ученый из OpenAI Ноам Браун считает, что ИИ может в целом улучшить математические способности людей
Вот так он прокомментировал новость выше о том, что люди переняли подход ИИ для опровержения известной гипотезы:
"После появления AlphaGo навыки игроков в Go заметно улучшились. Подозреваю, что мы увидим аналогичную закономерность и в математике".
Anthropic выпустили новый плагин для Claude Code, который будет проверять код на уязвимости прямо во время редактирования
По сути, это security-хук, который срабатывает при записи и редактировании файлов. Цель состоит в том, чтобы часть проблем отлавливались до PR, и Anthropic пишут, что при конечном ревью количество пойманных проблем действительно сокращается благодаря плагину до 40%.
Помимо отлова явных уязвимостей плагин также умеет сигнализировать о небезопасных паттернах кода в целом, а также следит за тем, чтобы агенты не трогали чувствительные файлы.
Доступно для всех пользователей бесплатно. Команда для установки: /plugin install security-guidance@anthropics-claude-codewww.claudepluginhub.com/plugins/anthropics-security-guidance-plugins-security-guidance-2
Система DeepMind автономно решила еще 9 задач Эрдеша
Стоимость решения каждой задачи составила несколько сотен долларов. Но есть нюанс: на самом деле DeepMind прогоняли через агента все 353 формализованные открытые задачи Эрдеша и сожгли гораздо больше ресурсов. Решение останавливали, если агент выходит за рамки 3000 итераций, и в итоге полностью решенных задач оказалось 9.
Статья с заявлением: arxiv.org/pdf/2605.22763v1. Здесь подробно описана архитектура самого агента AlphaProof Nexus, решившего задачи.
В базовом варианте это просто итерационный процесс: агент генерирует доказательство -> отправляет его на формальную проверку в Lean -> анализирует ошибки и пробует снова. Поверх этого также прикручен эволюционный поиск, когда агент перебирает ветки доказательств, хранит и анализирует промежуточные шаги и отбрасывает тупиковые идеи.
Помимо 9 задач Эрдеша (включая, кстати, две, которые были открыты на протяжении 50+ лет), Nexus также доказал 44 открытые гипотезы OEIS.
Кажется, DeepMind первые среди ИИ-лидеров провели настолько масштабный эвал агента на нерешенных задачах. Но точно далеко не последние. Решение открытых проблем уже становится похоже на бенчмарк.
Вот здесь выложили сами доказательтсва: github.com/google-deepmind/alphaproof-nexus-results
Spotify внезапно выпустили конкурента NotebookLM от Google
newsroom.spotify.com/2026-05-21/studio-by-spotify-labs-launch/
Компания выпустила новый десктопный Studio by Spotify Lab – приложение, в котором можно генерировать себе подкасты.
Вы называете нужную тему, по желанию подключаете личные сервисы (почта, календарь, заметки) и браузер, и получаете персонализированное аудио. Это может быть личный аудиобриф на день, ликбез по любому вопросу или что угодно еще.
Сейчас приложение в early preview
Внутри Google сформировали специальный внутренний «комитет по компьюту»
Он распределяет доступ к кластерам TPU/GPU среди подразделений и проектов компании и решает, кто получает приоритет, а кто ждет в очереди.
То есть в условиях дефицита ресурсов даже сотрудникам Google приходится буквально конкурировать за железо и шлифовать продажные презентации для внутреннего комитета, чтобы получить квоту на вычисления.
Если квоту не дали, то ты со своим проектом либо останешься ждать в очереди, либо можешь пойти и слезно просить занять компьют у другой команды.
На фоне этого из Google начали уходить исследователи. В основном они перебираются в маленькие стартапы, где нет никаких комитетов
📉 Финансовая модель нестабильна? Возможно, проблема в признаках
Модель обучается, но результаты нестабильны? Метрики скачут, признаки мешают друг другу, а причина неочевидна. Часто проблема скрыта в данных: корреляция и мультиколлинеарность искажают результат.
🦾 На открытом уроке разберём, как выявлять зависимые признаки и работать с размерностью данных. Покажем, как применять метод анализа главных компонент (PCA) для выделения действительно значимой информации.
Вы увидите, как упрощать пространство признаков, повышать устойчивость моделей и улучшать качество прогнозирования, особенно в задачах временных рядов. Это важный этап, без которого сложно перейти от экспериментов к стабильным решениям.
➡️ Встречаемся 18 мая в 20:00 МСК в преддверии старта курса «Машинное обучение для финансового анализа». Принять участие: https://otus.pw/3FQR/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
В одной из школ США родители ученика подали на учреждение в суд из-за того, что ИИ-детектор признал его сочинение сгенерированным
Учитель использовала для проверки его эссе детектор от Turnitin, и он определил сочинение как «на 76% сгенерированное ИИ». Дальше педагог разбираться не стала (несмотря на то, что парень предоставил историю правок из Google Docs и свои черновики), просто понизила оценку и влепила в личное дело пометку об академической нечестности.
Мы погуглили: Turnitin утверждают, что их false positive rate составляет менее 1%. НО это только для документов, которые более чем на 20% сгенерированы. На уровне предложений false positive rate крутится в районе 4%. Все равно немного, но сервис сам обращает внимание на то, что их результаты не стоит использовать в качестве последней инстанции.
Короче, 5 мая родители парня подали иск в Северный окружной суд Калифорнии: требуют восстановить оценку, удалить пометки о нарушении из школьного досье и получить компенсацию.
Иронично, что сочинение было по пьесе Артура Миллера «Суровое испытание». Это произведение буквально посвящено тому, как общество разрушает судьбы людей на основе ненадежных свидетельств.
DeepSeek ведет переговоры о первом раунде внешнего финансирования
Компания планирует привлечь $3–4 млрд при оценке до $50 млрд, как сообщает Reuters.
Правда, большинство денег, скорее всего, все равно вложит государство. А точнее, Китайский национальный фонд искусственного интеллекта. Кроме того, принять участие в раунде может Tencent Holdings.
Напоминаем, что DeepSeek ранее отказывался от внешних инвестиций, но теперь, судя по всему, меняет стратегию.
DeepSeek предложили новый способ улучшить мультимодальные модели
Сейчас модели нормально “видят” изображение, но рассуждают о нем через текст. Из-за этого они теряют точную привязку к объектам и начинают путаться в сложных сценах. В статье это называют Reference Gap.
Решение довольно прямое. Вместо чисто текстового ризонинга модель вставляет в процесс координаты. Это точки, чтобы вести путь по изображению, и рамки вокруг объектов. Сначала модель фиксирует, на что смотрит, потом строит рассуждение уже на этих привязках.
Архитектура при этом стандартная. ViT кодирует изображение, дальше все идет в MoE LLM. Новое именно в том, что визуальные примитивы становятся частью chain-of-thought, а не просто выходом модели.
Лучше всего это работает в задачах, где важна структура. Подсчет объектов, пространственные сравнения, лабиринты, трассировка линий.
Интересно, что DeepSeek довольно быстро удалил статью без объяснения причин. Скорее всего случился преждевременный релиз, а может и финальные результаты будут изменены. В любом случае (зеркало):
https://github.com/ailuntx/Thinking-with-Visual-Primitives/blob/main/Thinking_with_Visual_Primitives.pdf