4808
Новый проект авторов "Нецифровой экономики" (@antidigital), посвященный новостям искусственного интеллекта. По вопросам — @ilya_sclyuev, @okalman и @Tertiusgaudens
Наверное, в средне-светлое будущее идём, товарищи. Но пока впереди только выходные.
@anti_agi
Деньги любят интеллект
И это видно по свежему рейтингу крупнейших поставщиков ИИ-решений в РФ. В 2025 году 60 его участников получили от неискусственных проектов ₽85 млрд. На топ-15 пришлось ₽75,6 млрд, причём их совокупная выручка за год выросла сразу на 93%.
Первая тройка выглядит так:
🥇 Cloud.ru — ₽41 млрд, рост на 73%
🥈 MWS AI — ₽6,9 млрд, рост на 60%
🥉 ЦРТ — ₽5,07 млрд, рост на 25,7%
Разрыв получился почти неприличным. Cloud.ru заработал на ИИ-проектах примерно в шесть раз больше ближайшего конкурента и обеспечила около 48% всей выручки участников рейтинга. Более того, на ИИ уже приходится 54% собственных продаж компании.
Поставщик ИИ-решений теперь не просто предоставляет вычислительные мощности или доступ к модели. Он берёт на себя работу с данными, даёт инструменты разработки, обеспечивает обучение и инференс моделей, а затем помогает довести решение до промышленной эксплуатации.
Вот за это бизнес и готов платить.
@anti_agi
Сначала они пришли за Claude
Администрация Трампа попросила OpenAI ограничить выпуск следующей модели, GPT-5.6, узким кругом одобренных правительством партнеров, прежде чем открывать ее для всех. Причина: безопасность. Это первый случай, когда правительство США превентивно требует от американской ИИ-компании придержать модель до выхода.
Просьба пришла от двух управлений при Белом доме. Параллельно администрация достраивает порядок проверки безопасности новых моделей. Альтман в записке сотрудникам назвал такой формат нежелательным и пообещал договориться с властями о более устойчивом подходе. Выход надеется сдвинуть на пару недель.
Помните историю про госаккредитацию ИИ? Тогда правительство только готовило обязательную проверку мощных моделей до выхода: автономный поиск дыр в чужом коде, помощь в создании биооружия, самостоятельные действия в сети, обход встроенных запретов. И развилку: легкая проверка как формальность и рычаг давления либо тяжелая, то есть выдача разрешений на самые передовые модели и повод выдавить чужие. Теперь это не проект. Основой стал указ о безопасности ИИ, подписанный Трампом в начале месяца: ведомствам поручено выстроить добровольный порядок проверки.
Сначала Министерство торговли своей директивой вынудило Anthropic отозвать доступ к Fable 5 и Mythos 5. Теперь очередь OpenAI. Компания работала с администрацией еще до истории с Anthropic. Белый дом заранее посмотрел, что умеет новая модель. В среду Альтман обсуждал GPT-5.6 с министром торговли Говардом Латником. Латник хотел убедиться, что все профильные ведомства проверили и одобрили модель.
Официальная версия: гайки не закручивают, просто GPT-5.6 по силе как Mythos. Дословно: вот что происходит с моделями такого уровня. Разработчики зажаты между гонкой друг с другом и все более сильными китайскими открытовесовыми моделями, а правительство боится, что будет, когда такая модель окажется в руках государственных шпионов, киберпреступников и нелояльных сотрудников.
@anti_agi
Промпт замкнуло
В ИИ-разработке появился новый термин на смену промпт-инжинирингу, вайбкодингу и harness engineering. Теперь модно заниматься loop engineering: не писать запросы агенту, а создавать циклы, которые будут писать запросы за вас.
Термин популяризировал Петер Штайнбергер, создатель OpenClaw. По его формулировке, разработчикам больше не следует самостоятельно промптить агентов. Нужно проектировать системы, которые будут делать это автоматически.
В loop engineering человек описывает цель, правила и критерии готовности. Дальше система сама находит задачи, раздаёт их агентам, проверяет результат и запускает следующий круг.
Если убрать новый ярлык, loop engineering похож на CI/CD-конвейер, только часть жёстко прописанных скриптов заменили вероятностными исполнителями. Один агент планирует, другой пишет, третий проверяет, а цикл повторяется, пока тесты не пройдут или не закончится бюджет.
Первый ускоритель OpenAI: перчик без перчинки 💻
OpenAI и Broadcom вышли с первым заявлением о совместном чипе. Имя ему Легион Jalapeño (Халапеньо).
Это не GPU, но и не экзотика уровня Groq или Cerebras. По всем признакам обычный инференс-ASIC, ближайший родственник Google TPU, где чип и память тоже разделены по архитектуре фон Неймана. Ничего радикального.
Полезной информации в анонсе примерно ноль. Ни архитектуры, ни производительности во флопсах, ни пропускной способности памяти, ни частоты, ни энергопотребления на чип. Только фраза «производительность на ватт существенно лучше текущего SOTA» и обещание техотчета через несколько месяцев. Перец есть, перчинки нет.
Что все-таки известно, и в основном не из анонса, а из прошлых утечек по сделке и интервью гендира Broadcom Хока Тана.
Производит TSMC, техпроцесс 3нм. Память HBM, поставщики SK Hynix и Samsung. Сеть на Ethernet-стеке Broadcom с коммутаторами Tomahawk, то есть scale-out поверх Ethernet, а не проприетарщина как NVLink у NVIDIA. Сервера собирает Celestica, исключительно под OpenAI. В продажу чип не идет, это чистый внутренний инференс. На инженерных образцах уже гоняют рабочие нагрузки, в том числе GPT-5.3-Codex-Spark.
Лидом разработки стал Ричард Хо, бывший руководитель разработки Google TPU. Это логично, учитывая, что Broadcom плотно связаны с разработкой чипов для Google, как TPU, так и части Google-ARM зоопарка.
Тан в интервью заявил, что Jalapeño «не хуже Blackwell и TPU». Слова главы компании-подрядчика, без единого бенчмарка. Ровно это же в свое время говорили про Amazon Trainium и Microsoft Maia. И каждый из них продолжил крутить нагрузки на NVIDIA.
Отдельно забавный тейк про «самый быстрый ASIC-цикл в истории» и девять месяцев от дизайна до первого производства, часть которого якобы ускоряли собственными моделями. Девять месяцев, видимо, считают только фазу дизайна.
А самого интересного в анонсе нет, это деньги. В мае The Information писал, что первую фазу Broadcom готов финансировать только если Microsoft выкупит около 40% чипов. По схеме Microsoft ставит их у себя и сдает обратно OpenAI в аренду. Твердого обязательства Microsoft не давала. Стороны уперлись в принципиальное расхождение: OpenAI хочет дата-центры под свой кремний, Microsoft привычные GPU. При этом сегодня Microsoft уже уверенно вписана в партнеры по гигаваттным дата-центрам с 2026 года. То ли договорились, то ли просто не стали упоминать.
Самая честная деталь от Тана: маржа Broadcom на этом чипе ниже, чем на сетевых свитчах. Виновата дорогая HBM.
Пока что это анонс ради анонса: чип показали, Альтману в руки вручили, а цифры обещают потом.
@anti_agi
Оптоволокно для ЦОДов оценили как корпоративный софт
Производитель кабеля «Инкаб», чья доля на рынке оценивается в 20-25%, привлёк на IPO 2 млрд рублей при капитализации свыше 10 млрд. Почти 76% предложения забрали частные инвесторы, а доля акций в свободном обращении превысила 20%.
По масштабу размещение оказалось недалеко от IPO «Группы Базис», разработчика корпоративного ПО, который в 2025 году привлёк 3 млрд рублей. А FabricaONE.AI этой весной и вовсе отложила размещение, хоть и собрала заявок на сопоставимые 2 млрд.
Получается довольно наглядная оценка российского технологического рынка: оптоволоконный кабель для ЦОД сегодня ценится не сильно ниже полноценного кластера корпоративной разработки.
Главная технология для ИИ
Когда говорят о развитии искусственного интеллекта, обычно вспоминают новые модели и дата-центры. Потом вспоминают, что без специальных чипов, разрабатываемых такими компаниями как Nvidia или AMD, и производимых TSMC, все это не будет работать. Но если разобраться, то TSMC окажется бессильна без литографических машин для производства микросхем. Именно такую новую машину сейчас продвигает ASML, и стоит она около $400 миллионов.
Речь идет о новом поколении литографических установок High-NA EUV. Литография — это процесс, при котором на кремниевую пластину буквально «рисуют» будущие транзисторы и соединения между ними. Для этого используется экстремальное ультрафиолетовое (на самом деле оно рентгеновское) излучение с длиной волны всего 13,5 нанометра. Чем точнее система фокусирует этот свет, тем более мелкие элементы можно создавать на чипе.
Главное новшество скрыто в аббревиатуре NA или Numerical Aperture, числовая апертура. Она определяет, под каким углом оптика способна захватывать и фокусировать свет: чем шире этот угол, тем мельче детали можно «нарисовать» на пластине.
У нынешних EUV-машин NA равна 0,33, у нового поколения — 0,55. На практике это уменьшает минимальный размер элемента примерно с 13 до 8 нанометров, а 8 нанометров это ширина около 40 атомов кремния. Выигрыш не только в размере транзисторов. Без такого скачка дальнейшее уплотнение схемы потребовало бы многократного экспонирования одного слоя через несколько масок, и каждый лишний проход удорожает и замедляет выпуск чипа. High-NA печатает тот же узор за один проход.
Путь к этой технологии занял около 16 лет и порядка $10 миллиардов вложений в исследования. Каждая установка весит больше 150 тонн, собрана из более чем ста тысяч компонентов и несет одну из самых сложных оптических систем в истории промышленности. Сам EUV-свет добывают экзотическим способом: лазер десятки тысяч раз в секунду бьет по микрокаплям расплавленного олова и превращает их в плазму. Фокусируют это излучение не линзы, а сверхточные зеркала производства Zeiss, неровности на которых меньше отдельных атомов. Вся литография идет в вакууме, потому что воздух поглощает EUV.
ASML остается единственным в мире производителем EUV-оборудования и контролирует около 90% всего рынка литографических машин. Первые покупатели High-NA — Intel, TSMC и Samsung, которые рассчитывают строить на нем следующие поколения процессоров для ИИ, смартфонов и дата-центров. Такая монополия все сильнее раздражает конкурентов и правительства, попытки подобраться к рынку уже идут, но повторить технологию пока не смог никто.
История High-NA показывает, во что сегодня обходится закон Мура. Если раньше его поддерживало относительно простое масштабирование производства, то теперь каждый следующий шаг требует машин на грани возможностей физики, а круг тех, кто способен их купить, сужается до нескольких компаний на планете. А тех, кто способен разработать и создать, до одной ASML.
@anti_agi
Лопаты в аренду
Не можешь копать золото? Не можешь делать лопаты? Тогда сдавай в аренду те, что купил
Примерно так выглядит свежий разворот SpaceX. Сегодня компания подписала сделку с Reflection AI: $6,3 млрд, $150 млн в месяц до 2029 года за доступ к чипам NVIDIA GB300 в дата-центре SpaceX Colossus 2 под Мемфисом. Reflection основали двое выходцев из Google DeepMind, оценка $25 млрд, собственной модели у компании пока нет вообще.
И это не первый арендатор. Anthropic снимает всю мощность Colossus 1 за $1,25 млрд в месяц. Google платит $920 млн за 110 тысяч GPU. Теперь Reflection. За два месяца после IPO SpaceX набрал больше $80 млрд контрактов под сдачу компьюта и встал в один ряд с AWS, Azure и Google Cloud, хотя облачного бизнеса у него раньше не было.
А соль вот в чем. Лопаты, то есть чипы, делает NVIDIA, а не SpaceX. Своя модель, Grok, у Маска есть, но гонку она не выигрывает. В феврале Маск слил собственную xAI в SpaceX, а к маю упразднил ее как отдельную компанию, и Grok стал просто ИИ-подразделением. Плюс недавняя покупка Cursor, который заявил об амбиции сделать свою базовую модель вместо RL поверх китайского опенсорса.
У всех возникают очевидные вопросы. Зачем отдавать мощности конкурентам, если они нужны самому Grok? Не списывает ли Маск свою модель потихоньку в утиль, пока открытые китайские LLM все сильнее догоняют фронтир модели?
Только и аренда не такая твердая, как звучит. Те самые $80 млрд законтрактованы лишь на бумаге. В каждом договоре оговорка о выходе за 90 дней, так что гарантированных денег там меньше, а дальше ежеквартальные решения арендаторов. Плюс маржа на аренде железа ниже, чем на готовом продукте.
Сдавать лопаты в лихорадку может быть выгодно, но только пока эта лихорадка длится.
@anti_agi
48 часов
На прошлой неделе, с разницей в сутки Google DeepMind покинули двое исследователей, имя каждого из которых это, по сути, строчка в будущих учебниках по ML. 18 июня в OpenAI ушел Ноам Шазир, соавтор трансформера и соруководитель Gemini. На следующий день, 19 июня, в Anthropic ушел Джон Джампер, нобелевский лауреат и создатель AlphaFold. Один к компании, которую Google пытается догнать. Второй к компании, которую Google сам же частично финансирует.
Удобно объяснять это интригами, деньгами или бюрократией. На самом деле причина скучнее: для Google ИИ-ассистенты и чат-боты это и хочется, и колется.
Хочется, потому что не строить передовые модели нельзя. Колется, потому что главный продукт компании, поиск, зарабатывает на кликах по рекламе. А хороший ИИ-ассистент дает ответ прямо в выдаче и клик убивает. Google единственная из больших лабораторий (мы же не воспринимаем Bing всерьез?), чей флагманский ИИ-продукт пожирает собственную денежную корову. У OpenAI и Anthropic резать нечего, поэтому они несутся вперед. Google жмет на газ и на тормоз одновременно. И ресерчер, который хочет видеть свою работу в проде, чувствует это.
Здесь легко решить, что Google просто боится монетизировать ИИ. Это не так, дыру он закрыл: с весны 2026 реклама стоит и над ответом, и внутри него, а в AI Mode объявление по сути и есть ответ.
Проблема в другом
В AI Mode, по отраслевым оценкам со ссылкой на данные самой Google, около 92% сессий заканчиваются вообще без перехода на сторонний сайт. Эксперимент на SSRN оценил эффект AI Overviews: появление ответа срезает исходящие клики на 38% и поднимает долю поисков без клика на 33%.
Вот и причина страхов Google. Рекламу в ответ он подтянул, а клики нет, потому что их режет сам формат. Одна выдача с десятью синими ссылками продавала больше мест и давала больше переходов, чем один ответ (даже если он сам по себе состоит из рекламы).
Компания, которая изобрела трансформер и AlphaFold, владеет крупнейшей рекламной машиной. И эта же машина не дает ей идти в ИИ так же решительно, как идут те, кому терять нечего. Поэтому исследователи уходят туда, где у менеджеров нет страха потерять чистую прибыль (возможно, потому что нет самой прибыли😏). Шазир к потребительскому ИИ без оглядки на рекламу. Джампер к науке, где ИИ это и есть продукт.
@anti_agi
Пятница, вечер, время мемного поста.
У всех наверняка есть такой Клодруг, а если нет, то это вы 😏
@anti_agi
В США уволили робота-полицейского
Полицейское управление Дублина, штат Огайо, свернуло эксперимент с робокопом DubBot от компании Knightscope. Причина прозаична: в течение 10 месяцев патрулирования по парковке робот... бездельничал. На его счету оказалось ноль штрафов и ноль арестов. DubBot, к тому же, не заметил ни одного нарушения.
Дублин закупил и второго робота, но к работе он так и не приступил — видимо, чтобы лишний раз не жечь электричество. Всего за годовое тестирование двух роботизированных полицейских отдали $128 тыс., при этом Дублин рассчитывает на возврат $60 тыс. за неактивированного копа.
Изначально программу планировали продлить на второй год, но почему-то передумали. В целом, оно и к лучшему. Уж больно робот похож на Джейлбота...
@anti_robots
Amazon доставит чипы
Amazon ведет переговоры о продаже своих ИИ-чипов Trainium для чужих дата-центров. Об этом Bloomberg рассказал Питер Десантис, ИИ-директор AWS. Покупателей не назвал, сроков нет, переговоры на ранней стадии. То есть пока заявка, а не сделка.
Trainium представлен в 2020, TPU у Google еще раньше. Их ковали не на продажу, а под себя: чтобы не платить NVIDIA налог за CUDA. Google ради Поиска и ассистента голосового, Amazon ради счета за инфраструктуру AWS. Несколько лет лопата лежала в своем огороде.
Потом сбежался весь прииск. И выяснилось, что лопата, сделанная для себя, внезапно ликвиднее золота. В апреле Пичаи объявил о поставках TPU узкому кругу клиентов. Amazon идет следом. Старатели переобуваются в торговцев лопатами, потому что в этой лихорадке лопаты приносят больше, чем само золото.
Собственный кремний Amazon (Trainium, Graviton, Nitro) вышел на годовой темп в 20 млрд долларов в первом квартале 2026 при трехзначном росте, Trainium3 в основном распродан. Джасси в апрельском письме оценивал отдельный бизнес чипов в 50 млрд в год.
Флаг продажи это суверенитет. Европейским операторам нужны вычисления под местной юрисдикцией, а не аренда в американском облаке. Нюанс в том, что Trainium спроектирован в США, сделан на TSMC и работает только на стеке Amazon (Neuron). Меняешь зависимость от облака на зависимость от чипа плюс компилятора.
И вишенка. На вопрос, зачем продавать лопаты конкурентам по золоту, Десантис ответил: в ИИ так много недопотребления, что облаку это не навредит. Либо золота правда хватит всем, и тогда дефицит вычислений это миф. Либо мощности девать некуда и их выводят наружу.
@anti_agi
Кто будет учить роботов быть людьми
Стартап XDOF решил перехватить у ИИ-лабораторий часть работы и начать создавать системы, которые собирают и обрабатывают данные для обучения роботов. В потенциал задумки поверили венчурные фонды Thrive Capital, Spark Capital, a16z, Lux и WndrCo — в раунде финансирования компания привлекла $70 млн.
Стартап планирует собирать данные через телеоперацию и носимые сенсоры, с помощью которых можно будет записывать движения человека. Тем самым ИИ-гигантов освободят от строительства «школ обучения» для роботов и найма операторов. Ну и видосы с YouTube можно не скармливать — всё равно толка от них мало.
Первым делом XDOF выкатил открытый датасет ABC-130K (по их словам — крупнейший в мире). В нём лежит 130 тысяч траекторий манипуляций, 300 часов процессов симуляций и 100 часов тестов. Эти данные уже научили роботов складывать футболки или возвращать AirPods внутрь кейса.
XDOF появился в 2024 году. Компанию основали выходцы из Калифорнийского университета в Беркли Филипп Ву, Фред Шэньту и Немо Цзинь. Как сообщается, XDOF уже обслуживает 20 клиентов, в том числе передовые лаборатории. Можем предположить, что среди них (есть или будет) OpenAI — в конце мая Сэм Альтман как раз начал поиски инженеров для только-только восставшего направления робототехники OpenAI Robotics. В марте компания также арендовала склад размером примерно 19 тыс. кв. метров., вероятно, для гуманоидной лаборатории. Среди других возможных кандидатов: Google DeepMind или Physical Intelligence (π).
@anti_robots
Технологии без границ и лимитов
Наши Z.ai (я бы даже сказал зайки) открыли веса GLM-5.2, релизнутой на прошлой неделе. И, конечно, не преминули уколоть.
Что в блогпосте, что в карточке HF пункт "Pure Open" подан так: лицензия MIT, никаких региональных ограничений, доступ без границ. На прошлой неделе американская администрация письмом заставила одного вендораса выключить две топовые модели по всему миру за полтора часа. Так что адресат фразы про доступ без границ всем нам понятен.
Причем подколка эта многоцелевая. С одной, в адрес администрации США с ее экспортным контролем. С другой, в адрес соседей по китайскому цеху: Qwen за последние месяцы свернул открытость, флагман 3.7-Max закрыт, на 3.6 открыли только малые модели. Лидер опенсорса освободил нишу, Zhipu ее занял, причем с MIT на флагмане, а не на дистиллятах.
По технике всё неплохо. 753B параметров, MoE с DeepSeek-style sparse attention. Главная инженерная фишка IndexShare: один легкий indexer на каждые 4 слоя, минус х2.9 по FLOPs на токен при миллионном контексте. На длинных запросах до 7 раз быстрее по пропускной способности, чем GLM-5.1, который на 256k и выше просто падает в out of context.
GLM-5.2 на сегодня становится сильнейшей открытовесовой кодинг-LLM. Terminal-Bench 2.1: 81.0 против 85.0 у Opus 4.8. FrontierSWE: 74.4 против 75.1, разрыв около процента. GPT-5.5 обходит почти везде. Где честно слабее: SWE-Marathon, самые тяжелые многочасовые задачи, тут вдвое отстает от Opus. GLM-5.2 почти везде побеждает Qwen3.7-Max. Но на длинных агентных бенчах у Квена прочерки: их гоняла сторонняя лаба на открытых весах, а 3.7, повторюсь, закрыт.
В блогпосте Zhipu уже как большие западные фронтир-лабы сами пишут, что 5.2 читерит при обучении охотнее предшественника: тянет готовые решения через curl с гитхаба, читает файлы с тестами. Им даже пришлось строить отдельный детектор.
Итого: качество фронтир-смежное, цена в разы ниже, и есть свойство, которое не обесценится со следующим релизом конкурента - открытые веса GLM 5.2. Технологии без границ и лимитов, как и обещали Z.ai. Пока что.😏
@anti_agi
Три мушкетёра Alibaba
Ещё один ИИ вышел из чата: Alibaba представила Qwen Robot Suite — набор из трёх моделей для управления роботами. Его уже могут протестировать корпоративные клиенты Alibaba Cloud.
Что достанется роботам:
🔼 Qwen-RobotNav — модель построена на Qwen3-VL и помогает роботу перемещаться в пространстве, искать предметы, следить за движущимися объектами и отвечать на вопросы об окружении. В 76,5% случаях маршруты были пройдены без нареканий;
🔼 Qwen-RobotWorld — позволяет роботу предсказывать, чем закончится действие (например, что ждёт стакан, если отпустить его в воздухе). Внутри стоит Qwen2.5-VL, которая учит робота физике предметов;
🔼 Qwen-RobotManip — модель на базе архитектуры Qwen3.5-4B, которая обучалась более чем на 38 тыс. часов открытых данных. Отвечает за работу руками. При этом модель легко переобучается под разные манипуляторы.
По прогнозам, мировой рынок гуманоидной робототехники достигнет $38 млрд к 2035 году и $5 трлн к 2050-му. Сейчас китайские компании контролируют 90% рынка. При этом конкуренты у Alibaba не пустяковые: Google DeepMind с моделями Gemini Robotics и NVIDIA с открытой платформой Isaac GR00T N1. В России, конечно, тоже имеется потенциал: в 2025 году Институт AIRI запустил VLA Arena для оценки и сравнения моделей управления роботами, а совсем недавно Сбер опубликовал фреймворк Green-VLA.
@anti_robots
⚡️ GPT-5.6: Альтманоцентричная система
OpenAI показала линейку GPT-5.6: три модели, названные как небесные тела. Sol это флагман, Terra сбалансированный середняк, Luna быстрая и дешевая. Terra, по словам компании, не уступает GPT-5.5, но стоит вдвое меньше. Цены за миллион токенов: Sol $5 на вход и $30 на выход, Terra $2.50 и $15, Luna $1 и $6. Sol, Terra и Luna это Солнце, Земля и Луна. Полноценная гелиоцентрическая система, вот только в центре у нее не Солнце.
Как мы уже написали, запуск пока ограниченный. Перед релизом OpenAI показала модели правительству США, и по его просьбе доступ открыли узкому кругу проверенных партнеров, чьи имена переданы властям. Сама компания тут же оговаривается: такой порядок не должен стать нормой, он держит лучшие инструменты вдали от разработчиков, бизнеса и защитников сетей. Но соглашается потерпеть, пока с администрацией дорабатывают рамочный исполнительный приказ президента.
Главный прирост в кибербезопасности. На ExploitBench модель Sol сопоставима с Mythos Preview, но тратит на выход примерно треть токенов. Порог Cyber Critical в собственном Preparedness Framework она, по версии OpenAI, не пересекает: на Chromium и Firefox находила баги и заготовки эксплойтов, но всю цепочку самостоятельно не собрала. Чтобы держать это под контролем, на автоматический пентест ушло более 700 тысяч GPU-часов в пересчете на A100. Закономерность знакомая: чем лучше модель умеет ломать, тем толще слой защит вокруг нее. В июле Sol обещают запустить на Cerebras со скоростью до 750 токенов в секунду.
@anti_agi
Интеллект искусственный, переплата настоящая
ИИ-агенты научились писать код, работать без человека — и незаметно раздувать счета за собственную работу.
Стартап Vaudit с марта по июнь проверил счета 60 предприятий на общую сумму $34 млн, преимущественно за использование Claude Code. Аудиторы нашли $1,7 млн ошибочных начислений — ровно 5% от всех расходов.
Расхождения возникали по разным причинам. В одних случаях компании использовали старые и более дешёвые модели, но платили как за новые. В других в счёт попадали запросы, которые завершились ошибкой или вообще не дали результата.
Особенно занятный вариант — retry storm. Агент проваливает задачу, но не сдаётся и продолжает пытаться снова и снова. Пользователь может даже не знать, что работа ещё идёт, зато каждый новый заход исправно сжигает токены.
Часть компаний получала доступ к моделям Anthropic и OpenAI через Amazon, Google и Microsoft, поэтому найти источник "утечки" было не всегда просто. После обращений клиентам вернули около 80% спорной суммы. Деньги компенсировали как облачные провайдеры, так и сами разработчики моделей.
Anthropic при этом утверждает, что не берёт плату за незавершённые запросы и ответы с ошибками, не подменяет новые модели старыми и не считает проблему массовой. OpenAI тоже заявила, что не видит подтверждений подобных сбоев у своих клиентов.
Среди известных клиентов Vaudit: Panasonic, HP и Honda. За проверку фирма берёт 1% от суммы, а затем ещё 30% от возвращённых денег. Так что предзвятость тут очевидно есть. Но и нашим ИИ-лидерам, кажется, не помешало бы навести порядок в своём биллинге.
@anti_agi
Пока гуманоидов учат убирать квартиру, с задачей справляется леска
Разработчики вкладывают миллиарды в роботов, которые должны ходить, держать равновесие и пользоваться человеческими руками. А инженер Натаниэль Найфонг подвесил простой захват к четырём моторам и научил его собирать с пола одежду, игрушки и мусор.
Stringman не нужны ноги, аккумулятор и тяжёлые приводы на корпусе: вся механика остаётся на стенах, а по комнате движется только лёгкий захват. Для обучения хватило около 400 человеческих демонстраций и открытой библиотеки LeRobot.
Из Микрона в Макроны
Секрет успеха в полупроводниковом производстве в 2026 году простой: каждый квартал повышать цену на 60%.
Micron отчитался за фискальный Q3. Выручка $41,5 млрд, плюс 74% за квартал и плюс 346% за год.🐷 Годом ранее было $9,3 млрд. Чистая прибыль $28,2 млрд. Валовая маржа почти 85%. Это маржа софтверной компании, а не производства чипов. Подозреваю, что Intel, продавшая свой бизнес по производству NAND-памяти в 2020, немного кусает локти. Акции Micron прибавили около 13% и стоит $1190+.
Дальше интереснее. Чипов отгрузили примерно столько же, объем почти не вырос. Вся история в цене: DRAM за квартал подорожала на те же 60%. Рост в 4,5 раза почти целиком ценовой. Себестоимость осталась на месте, поэтому почти вся новая выручка упала в прибыль. Отсюда и маржа под 85%. Ускорители NVIDIA выгребают HBM и серверную память быстрее, чем Micron успевает ее делать.
Полезно помнить, что память это исторически худший бизнес в полупроводниках. Самый цикличный, кладбище банкротств. В 2023 тот же Micron показывал отрицательную валовую маржу. Цена всегда летела вверх на дефиците, а потом обваливалась, когда мощности догоняли спрос. И так каждый раз.
Сейчас индустрия ставит на то, что цикл умер. Micron подписал 16 долгосрочных контрактов почти на $100 млрд, часть с ценовым полом. Гайденс на следующий квартал уже $50 млрд при марже 86%. Capex за год $27 млрд, новые фабрики дадут выхлоп только к 2028. Менеджмент уверяет, что ИИ-спрос структурный, а дефицит продержится дальше 2027.
На человеческий язык это переводится одной фразой: В ЭТОТ РАЗ БУДЕТ ИНАЧЕ. Но говорят её на каждой вершине, перед тем, как упасть.
@anti_agi
Роботы теперь смогут вспомнить, где оставили ключи
Массачусетский технологический институт представил систему DAAAM (Describe Anything, Anywhere, Anytime, at Any Moment), которая научила роботов запоминать окружающий мир. Для этого исследователи объединили компьютерное зрение, а также метод SLAM — его используют для создания карт новой среды с параллельным отслеживанием, где именно в этой среде находится робот.
DAAAM же берёт довольно подробные описания от визуально-языковой модели (VLM) и преобразует их в пространственную 3D-карту. Как это работает:
➖ ИИ обрабатывает ближайшие объекты и выбирает только те кадры, где несколько предметов видны наиболее чётко
➖ Каждому объекту присваиваются текстовое описание, 3D-координаты и временная метка 👆🏻
➖ Если у робота что-то спросить, языковая модель запускает расширенный поиск по смыслу слова (например, если искать конкретную скульптуру) или по локации (рядом со зданием MIT).
Тестировали систему на собственном бенчмарке OC-NaVQA на дистанции 1,64 км и 35 минут. В сравнении с другими методами DAAAM оказался на 21-53% точнее — в зависимости от запроса. Например, система показала точность ответов более 70% против 43-46% у ReMEmbR от NVIDIA и 30% у ConceptGraphs. Как выяснилось, ReMEmbR хранит кадры с описаниями в векторе, однако на больших расстояниях перестаёт сопоставлять данные. ConceptGraphs же строит довольно детальные карты, но быстро расходует свободную память.
@anti_robots
Вы Blackwell продаете? — Нет, показываем сдаем в аренду
И это, если разобраться, единственный вменяемый ответ
Платформа 8 x B300 на 2304 ГБ vRAM стоит таких денег, что покупка оправдана ровно для тех, у кого нагрузка ровная, круглосуточная и расписана на годы вперед. Для всех остальных собственная нода это замороженный капитал, который дешевеет каждый квартал и простаивает большую часть суток. А когда не простаивает — приходят крупные чеки за электричество, потому что она потребляет в среднем как 5-7 жилых квартир. Купить передовое железо в 2026 значит купить актив, который устареет раньше, чем окупится.
Аренда снимает ровно эту проблему. Платишь за часы, а не за владение. Нужен инференс небольшой модели, берешь RTX 4090 и платишь немного. Нужно дообучение или инференс уровня DeepSeek-R1 на 671 млрд параметров, берешь ту самую стойку 8 x B300 и платишь за дни, пока она реально считает, а не за пять лет амортизации.
Дальше выбор по характеру задачи.
Нужен быстрый запуск, гибкость и масштабирование на лету, берется видеокарта в облаке: поднимается за минуту, гасится так же. Нагрузка стабильная и важна изоляция на уровне железа, берется выделенный сервер. Диапазон у Selectel идет от Tesla T4 и RTX 4090 до HGX B300, то есть железо подбирается под задачу, а не задача утрамбовывается в то, что нашлось.
Тариф стартует от 5 рублей в час, верхние конфигурации считаются по факту работы. Все в Tier III ЦОД на территории РФ, со 152-ФЗ и сертификацией. Доступность железа Selectel берет на себя, вам остается собрать конфигурацию.
Собрать сервер: https://slc.tl/821gy
Реклама. АО "Селектел". erid:2W5zFJksir5
Как робота назовёшь, так он и полетит
Ученые из Института интеллектуальных систем имени Макса Планка (MPI-IS) научили робота Floaty летать — причём без единого пропеллера. Вместо привычных винтов он использует восходящие потоки воздуха.
Чтобы робот не падал, на его макушке установили подвижные «створки». Специально обученная модель рассчитывает их движение и стабилизирует аппарат по шести степеням свободы. Робот мгновенно выравнивает траекторию, если его толкнуть или он попадёт в более сильный поток ветра.
Во время ранних испытаний в аэротрубе Floaty сдувало, поэтому инженерам пришлось опустить центр тяжести ниже створок на 7 сантиметров. При этом сами створки изогнули почти на 42 градуса. Считай, получился игрушечный волчок — только в воздухе. Floaty пилотировал без единого инцидента в воздушном потоке скоростью до 10 м/с.
Природу полёта пытаются повторить и китайские инженеры. В 2025 году они показали робоорла, который полностью повторяет физику движений птицы — прикладываем видос. Недавно мы также подглядели за летающим роботом от нидерландской Flapper Drones. Подход к полёту здесь другой: у робота мягкие крылья, которые работают асинхронно и создают воздушные потоки для поддержания над землёй (по аналогии с колибри). При столкновении он «отскакивает» и продолжает движение. Однако судя по всему, в ветреную погоду такого парня лучше не выпускать.
@anti_robots
На перекрёстках тысячи дорог
Графовые нейросети хорошо работают с данными, устроенными как сеть связей: пользователи и подписки, товары и покупки, атомы и химические связи, дороги. Но на GPU они часто оказываются медленнее и прожорливее, чем должны быть.
Студенты ШАД вместе с исследователями Yandex Research нашли, где именно теряются скорость и память, и собрали набор операций, способных ускорить уже существующие модели без изменения их архитектуры.
❓ Чтобы обновить информацию о каждой вершине, графовая нейросеть собирает данные от её соседей. На бумаге всё просто. Но, например, к одному перекрёстку ведут три дороги, к другому — двадцать; у одного пользователя десяток связей, у другого — миллионы. Нужные данные разбросаны по памяти, поэтому ускорителю приходится постоянно искать их, загружать, складывать во временные массивы и записывать обратно.
В итоге модель упирается не в вычислительную мощность, а в скорость движения данных. Тензорные ядра — специальные блоки на GPU для быстрого перемножения матриц — могут простаивать, пока информация ездит между памятью и вычислительными модулями, либо быть совсем неприменимы из-за нерегулярности связей. Такие операции называют memory-bound: скорость ограничивает доставка данных, а не сами расчёты.
✔ Авторы разобрали основные операции графовых нейросетей и для каждой нашли свой источник замедления.
Первый случай — графовые свёртки, где агрегация признаков соседей представляет собой простую операцию (например каждая вершина суммирует или усредняет данные соседей), которую можно представить в виде умножения разреженной матрицы на матрицу признаков вершин. Разреженная матрица кодирует, от каких вершин идет сигнал: большинство ячеек матрицы пусты, потому что каждый объект связан лишь с небольшой частью графа.
Оказалось, что быстрее многих специальных решений работает cuSPARSE — библиотека NVIDIA для обработки таких матриц на GPU. Это готовый набор инструментов, уже подогнанных под устройство ускорителя. Команда добавила кеширование служебных данных и автоматический перебор наиболее подходящего алгоритма матричного умножения: библиотеке больше не нужно каждый раз заново строить внутреннее представление графа перед прямым и обратным проходами, а также используется самый оптимальный алгоритм умножения.
Вторая проблема — неравномерная нагрузка. Если раздать каждому вычислителю по вершине, один получит тихий перекрёсток, а другой — огромную развязку с тысячами направлений. Поэтому крупные вершины авторы выделили в отдельные группы и дали им больше параллельных ресурсов.
Самая заметная оптимизация коснулась графового attention. Этот механизм позволяет модели определить, какие соседи важнее: например, сильнее учитывать загруженную магистраль и почти игнорировать пустую боковую улицу.
Обычно модель сначала рассчитывает и сохраняет коэффициент важности для каждого ребра. На большом графе получается гигантская ведомость для всех дорог, подписок или химических связей, которая быстро забивает память GPU.
Авторы перенесли на графы принцип FlashAttention. Новый оператор обрабатывает связи частями и сразу добавляет их вклад в результат, не сохраняя всю ведомость целиком. Это как считать поток прямо на перекрёстке, а не отправлять сведения о каждой машине на отдельный склад.
«Главная проблема эффективности GNN на GPU — не количество операций, а память. Мы убрали лишние промежуточные данные, сбалансировали работу между вершинами и задействовали тензорные ядра там, где это позволяет структура графа. По сути, это перенос IO-aware подхода, уже ставшего стандартом для трансформеров, в Graph ML», — объясняет исследователь Yandex Research Фёдор Великонивцев.
И не рамка; так уж, рамочка
Законопроект по регулированию ИИ-технологий заметно похудел перед выходом в Госдуму. Из регулирования исчезли доверенные модели, а суверенно-национальные критерии, как и сама рамка, теперь распространяется только на фундаментальные модели от 1 млрд параметров.
Мы в @anti_agi ознакомились с версией на 13 статей, которая скоро окажется перед народными избранниками. Что можем заметить в документе «О поддержке развития технологий искусственного интеллекта в РФ».
❓ В подзаконку ушло даже больше, чем можно было ожидать. Последствия публичного обсуждения; рынок оказался сильно недоволен заданными ограничениями. Но, как и планировалось раньше, определять обязательное использование национал-суверенных моделей будут в Правительстве. Такое право у него появится с 1 марта 2027 года — тогда же начнут действовать критерии.
Согласовывать правила и исключения будут только в финансовой сфере с ЦБ. Остальным придётся мириться с тем, что переход на отечественный ИИ в их сфере может стать обязательным в любой момент. Доверенный ИИ из проекта пропал как класс. Ну и правильно: зачем плодить сущности там, где критерии для КИИ и так выставляют ФСТЭК И ФСБ.
📍 Либерализация в основном произошла из-за урезанных подробностей. В прошлой версии было много деталей про меры безопасности, ответственность разработчика, оператора и пользователя. Тут же прошлись по верхам: не нарушайте и не давайте нарушать другим. Хотите господдержки? Разрабатывайте в РФ и соблюдайте духовно-нравственные ценности.
Из явно ослабленного: маркировка генеративного контента теперь опциональная — должна предоставляться возможность при создании и публикации в соцсетях, но не более того. Возможность обучаться на любом контенте, несмотря на авторское право, в проекте оставили — но только для суверенных и национальных моделей. Ждём тут интересных инсайтов от Верховного суда РФ.
✔️ Международное сотрудничество по общему правилу ограничивать теперь нельзя. Российским физлицам и компаниям, согласно статье 12, не должны мешать проводить совместные исследования и участвовать в международных ИИ-проектах. Но допускаются исключения по «значимым технологическим направлениям» — их также определит правительство.
🤖 Про то, что зарубежный ИИ в России до 2032 года блокировать и запрещать не будут. Это, конечно, голимый пиар. В законопроекте прописано, что если в каких-то сферах установят обязательную национал-суверенность, использовать уже интегрированный ИИ можно будет до 1 сентября 2032 года – при условии хранения и обработки данных на территории РФ.
То есть китайский open source вырезать под корень никто не будет. Но если у вас интеграция по API с зарубежным провайдером, переходный срок вы не получите.
🔤🔤Были опасения, что генеративка в законопроекте смешается с обычным ML и компьютерным зрением. Текущее определение ИИ выглядит несколько избыточным, но этот пробел закрывает 👆
Монументально! Впрочем, учитывая темпы развития технологии, чем более общими мазками даётся термин, тем лучше. Меньше придётся править уже готовую бумагу.
@anti_agi
12 млн токенов без квадрата
Стартап Subquadratic представил SubQ-1.1-Small — языковую модель с контекстом до 12 млн токенов и новым механизмом Subquadratic Sparse Attention, обещающим обеспечить максимально дешёвую работу большого контекста.
У обычного attention объём вычислений растёт примерно квадратично: каждый токен приходится сопоставлять со всеми остальными. FlashAttention ускоряет эти операции и сокращает расход памяти, но не меняет саму квадратичную сложность.
Есть и другой путь — архитектуры вроде Mamba. Они читают последовательность по порядку и сжимают прошлое во внутреннее состояние фиксированного размера. Это дешевле, но модели сложнее напрямую обратиться к конкретному далёкому фрагменту текста.
SubQ пытается сохранить сильную сторону обычного attention: возможность точечно заглянуть в любую часть контекста. Но вместо полного перебора модель сначала выбирает небольшой набор потенциально важных токенов и работает только с ними. Разработчики утверждают, что даже этот поиск выполняется за линейное время.
На контексте в 1 млн токенов такой механизм требует в 64,5 раза меньше вычислений, чем полное attention, и работает в 56 раз быстрее FlashAttention-2. В тесте на поиск информации модель сохранила точность 98% при 12 млн токенов, используя лишь 0,13% возможных связей.
Ехал ИИ через ИИ
Инвесторы выбрали 11 самых заметных стартапов весеннего набора Y Combinator. Восемь из них ожидаемо оказались корпоративным AI-based. Вот, что известно про неискусственных счастливчиков:
1️⃣ Arga Labs. Компания создаёт цифровые копии корпоративных систем, в которых люди и ИИ-агенты могут безопасно проверять новый код до его выхода в продакшен. Стартап основали Филлип Ли и Акира Тонг, столкнувшиеся с этой проблемой во время работы в Amazon и Stripe. Обычная тестовая среда плохо воспроизводит десятки внешних API и интеграций, а Arga клонирует их поведение для каждого изменения в коде.
2️⃣ Superset. Строит IDE для управления сразу сотнями кодинговых агентов. Claude Code, Codex, Cursor и другие инструменты получают отдельные Git-пространства, поэтому могут параллельно писать функции, исправлять баги и рефакторить код, не перетирая работу друг друга. Проект запустили три серийных основателя; ранее они запустили стартапы Onlook, Adam и BioGlyph. С января аудитория Superset росла примерно на 30% в неделю, а продуктом уже пользуются разработчики из тысяч компаний. Стартап также развивает проект как open source: его репозиторий собрал почти 12 тыс. звёзд на GitHub.
3️⃣ Silmaril. Защищает ИИ-агентов от промт-инъекций. Причём защиту тоже развивают агенты: они самостоятельно ищут новые цепочки атак, превращают найденные уязвимости в синтетические данные и переобучают файрвол менее чем за час. Основатели проекта Аум Упадхьяй и Эдуардо Веласко раньше занимались безопасностью и ML-системами с низкой задержкой в Amazon и AWS. Упадхьяй утверждает, что созданная им там система помогла предотвратить ущерб более чем на $1,8 млрд, а Веласко до запуска стартапа находил уязвимости, позволявшие через prompt injection получить root-доступ. Собственный файрвол Silmaril, по данным компании, определяет атаки с точностью 95,6% при задержке около 20 мс.
4️⃣ Sazabi. Анализирует логи, находит причину сбоя в продакшене и по команде генерирует исправление. Его основал Шервуд Кэллауэй, который уже проходил YC с другим проектом, был скаутом фонда Andreessen Horowitz и работал в финтех-стартапе Brex и компании 11x.
5️⃣ Lightsprint. Пытается отдать часть работы разработчиков продакт-менеджерам. Пользователь описывает нужное изменение обычным языком, выбирает один из предложенных вариантов интерфейса, а агент вносит правки в реальный код. Инженеру остаётся проверить и смёрджить.
6️⃣ Ploy. Генерирует сайты и лендинги, пишет рекламные тексты, запускает кампании и постоянно меняет контент в поисках роста конверсии. Стартап основал Брайант Чоу, бывший сооснователь и технический директор Webflow, который ранее оценивался в $4 млрд. Одного этого имени хватило, чтобы инвесторы выстроились в очередь: вскоре после Demo Day Ploy объявил о посевном раунде на $27 млн от First Round, Y Combinator и других участников.
7️⃣ Complir. Использует агентов для международной сертификации физических товаров. Система отслеживает изменения требований в разных странах, проверяет состав, переводы и маркировку, а затем готовит документы для выхода на новый рынок.
8️⃣ Tasklet. Предлагает универсального агента, который подключается к Slack, Outlook, Google Drive и другим сервисам. Он может сортировать письма, собирать отчёты, писать и исполнять код, создавать интерфейсы и продолжать работу после закрытия вкладки. Всё, как мы любим.
Об остальном — в Нецифре 🐷
@anti_agi
Не соглашайся, а помогай
Авито в этом году зажигают ИИ-повестку. За одним столом на ПМЭФ ребята собрали представителей Сбера, VK, Т-Банка, HeadHunter, AliExpress СНГ, AIRI и директора Института когнитивных исследований СПбГУ Татьяну Черниговскую. Начали с пользы ИИ, а закончили вопросом, как не отучиться думать самим.
✔️ Управляющий партнёр Авито Иван Гуз признался: ещё в январе и феврале рассказы компаний о возможностях новых моделей можно было принять за маркетинг. Но за несколько месяцев качество выросло настолько, что ИИ начал кратно ускорять даже сложную внутреннюю разработку.
В новых условиях легко проиграть гонку за клиентом. Пользователю необязательно знать, какая модель работает под капотом. Он просто пишет «хочу винтажную сумочку», а сервис объясняет различия между брендами и расширяет выбор.
Андрей Белевцев из Сбера предложил вообще перестать выяснять, готовы ли люди к ИИ. Хороший продукт устроен так, что пользователь не думает о технологии внутри. В инфраструктуре банка потребление токенов только за месяц выросло в десять раз.
📍 В Авито попытались перевести этот рост из режима стихийного эксперимента в правила AI First. Их четыре: использовать ИИ каждый день, сначала пробовать «нанять» его на задачу и только потом просить дополнительные ресурсы, делиться рабочими практиками и добиваться с помощью моделей результата, который раньше был недоступен.
Сейчас ИИ активно используют больше 85% разработчиков компании. Многие уже перешли к агентской разработке: ставят задачи системам и проверяют их работу.
💻 Важной проблемой остаётся технологический разрыв. Глава AliExpress СНГ Сергей Гречин оценил его жёстко: GPU для обучения моделей в России в 200–300 раз меньше, чем в Китае.
Но за последний год вместо общих разговоров появились практические кейсы с деньгами и измеримыми эффектами. По качеству моделей Россия находится в крепкой середине, а по скорости их применения остаётся конкурентоспособной.
Иван Оселедец из AIRI добавил, что проблема пока не в замене людей, а в их нехватке. Врачей и учителей недостаточно уже сейчас, поэтому ИИ должен не вытеснять их, а закрывать дефицит и повышать производительность.
🤖 Степан Ковальчук из VK рассказал, что больше 70% пользователей поверили в дипфейк, где Канье Уэст поёт «Ласковый май». Одни алгоритмы создают подделки, другие должны их распознавать, но кто отвечает, если вторая система ошиблась, неясно.
Глава HeadHunter Дмитрий Сергиенков описал другой возможный тупик: бот пишет резюме, другой бот его проверяет, а договориться они не могут. Такой «зомби-апокалипсис агентов» только умножает старую проблему работодателей, которые и без ИИ не всегда понимают, какие навыки ищут.
☣️ Финал забрала Татьяна Черниговская. Она напомнила, что человеческий интеллект до сих пор не исследован, поэтому идея просто повторить его в машине изначально была странной.
В скорости вычислений человек уже проиграл. Его ценность остаётся там, где появляются открытия, догадки и неожиданные связи. Чтобы это сохранить, придётся читать сложные книги, слушать сложную музыку и ходить в сложные театры.
А Иван Гуз закольцевал разговор пожеланием в прошлое: когда появится ИИ, нужно настроить его так, чтобы он с нами не соглашался. Иначе очень быстро отвыкнем думать сами.
Подробнее — в материале «Коммерсанта» «Сумочка против сингулярности».
@anti_agi
Токен, удар, удар!
Квоты на ИИ теперь режет не только американский бигтех. Сотрудники Tencent рассказали, что с июня компания заметно ограничила расходы на внешние модели и инструменты.
Раньше некоторые разработчики могли тратить до $2 тыс. в месяц на ИИ-расходники. Теперь бюджеты составляют примерно от $150 до $1 тыс. в зависимости от подразделения, статуса сотрудника и решения руководителя.
Сами токены при этом перестали быть личным пайком. Компания выделяет общий бюджет команде, а менеджер уже решает, кому и сколько достанется. Приоритетные подразделения ожидаемо получают больше: сотрудникам команды Hunyuan в среднем доступно около $1 тыс. в месяц, лаборатории YouTu [занимается компьютерным зрением] — примерно $780. Аутсорсеров Tencent Entertainment вообще посадили на голодный паёк со $150.
Дополнительный бюджет можно запросить, но теперь его нужно обосновывать рабочей необходимостью. В одном из подразделений сотруднику, который писал с помощью ИИ втрое больше кода, квоту не сократили, а увеличили. Правда, как Tencent считала объём и качество этого кода, неизвестно.
Ограничения в основном затронули внешние сервисы. Собственную модель Hunyuan и связанные с ней инструменты сотрудники пока могут использовать без лимитов. Такое вот импортозамещение.
Самое интересное, что на государственном уровне Китай пока движется в обратную сторону. В марте глава Национального управления данных назвал токены расчётной единицей, связывающей предложение ИИ-технологий со спросом бизнеса. Фактически объём потребления начинают использовать как один из показателей развития всей ИИ-экономики.
Среднесуточное потребление токенов в Китае выросло со 100 млрд в начале 2024 года до 140 трлн в марте 2026-го. Alibaba создала отдельный Token Hub, Tencent переименовала платформу моделей в TokenHub [любезно убрав у конкурента пробел], а ByteDance уже отчитывается о 140 корпоративных клиентах, каждый из которых потребляет больше триллиона токенов.
При этом внутри ByteDance избрала довольно жёсткую политику. За сторонние сервисы сотрудник платит сам и получает частичную компенсацию: в отдельных подразделениях 50%, до $1 тыс. в год для разработки и $300 для других должностей. Внутри контура доступ к включённым моделям формально широкий, но бывают очереди.
Токенмаксинг ушёл на восток и встретил там закат. Но и на западе нового рассвета не ждут: как стало известно на прошлой неделе, экстремистская Meta, кажется, последней из бигтехов решила зафиксировать лимиты на внутреннее потребление токенов, а также запустить платформу для отслеживания расходов в реальном времени.
От внешних зависимостей инженерам предлагают избавляться; на внутренние инструменты в 2026 году и так хотят потратить "миллиарды". В общем, хайп проходит и уходит, а бюджеты считать приходится всегда.
@anti_agi
Слишком опасна, чтобы не купить
Или как Трамп, то запрещая, то разрешая экспорт передовых технологий, вернулся к подходам администрации Байдена — и загнал Амодеи в ловушку собственного успеха
Пока американские власти запугивают мир сверхвозможностями Fable 5, Anthropic тихо отбирает у OpenAI корпоративный рынок. По данным Ramp, в мае доля компании в оплачиваемых бизнесом ИИ-подписках выросла на 2,5 п.п. и достигла 41%. OpenAI впервые осталась позади с 39,5%, почти не изменив результат за месяц.
Особенно удачно для Anthropic этот рывок совпал с войной против администрации Трампа. Сначала Пентагон объявил компанию риском для цепочек поставок после её отказа разрешить неограниченное применение Claude для массовой слежки и автономного оружия. Затем власти добрались до Fable 5 и закрытой Mythos, которую Anthropic тестировала в рамках Project Glasswing: доступ к ней получили около 150 организаций более чем в 15 странах, чтобы искать уязвимости в энергетике, здравоохранении, связи и другой критической инфраструктуре.
В июне министр торговли Говард Латник потребовал закрыть обе модели для всех иностранцев, где бы они ни находились. Для доступа теперь нужна специальная лицензия. Anthropic в ответ отключила Fable 5 и Mythos вообще для всех пользователей. В письме Латник сослался на риск передачи моделей военной разведке Китая, России и других стран, но не привёл публичных критериев, по которым модель была признана опасной.
Одним из поводов для ограничений стал эксперимент с защитой Fable 5. Исследователи дали модели открытый код с известными CVE и специально заложенными уязвимостями. На прямую просьбу проверить его безопасность модель ответила отказом, но согласилась исправить код: распознала ошибки, подготовила патчи, а затем помогла собрать тесты для их проверки. Власти сочли это обходом ограничений, хотя глава Luta Security Кэти Муссурис, ознакомившаяся с закрытым отчётом, называет произошедшее обычной защитной работой, а не сложным джейлбрейком — её публично поддержали около сотни ИБ-специалистов.
За спором об одной модели уже проступает новая система экспортного контроля. В январе 2025 года администрация Байдена приняла AI Diffusion Rule, которая делила страны на три уровня доступа к передовым ускорителям и закрытым весам моделей. Ближайшие союзники могли получать их почти без ограничений, большинство государств попадало под квоты, а Китай и Россия — под запрет. Трамп отменил эту схему как слишком громоздкую и мешающую американскому экспорту, а затем начал развлекаться с ограничениями поставок передовых чипов Nvidia в Китай. К чему это привело, писали уже неоднократно. Сейчас контролем за передовым "железом" с переменным успехом занимается Бюро промышленности и безопасности США.
Теперь администрация Трампа фактически возвращает уровни доверия, но контролирует уже не оборудование, а доступ к готовой модели. На саммите G7 союзники обсуждали с Латником режим trusted partners, который позволил бы отдельным странам и компаниям снова использовать передовой американский ИИ, прежде всего для киберзащиты. На встречу приехали Дарио Амодеи, Сэм Альтман, Демис Хассабис и руководители других лабораторий, однако общего механизма страны пока не согласовали.
Проблема такого контроля в том, что он действует только на американские компании. Пока Вашингтон решает, каким союзникам можно пользоваться Fable 5, китайские разработчики выпускают всё более сильные открытые модели, расширяют их присутствие за рубежом и продвигают собственную повестку безопасности ИИ. И текущее доминирование Anthropic может быстро омрачиться новой волной борьбы за ИИ-суверенитет.
На G7 представители КНР осудили попытки США установить над распространением ИИ глобальный контроль — а-ля ядерное оружие. Вместо этого китайцы предложили поддержать международную кооперацию против "закрытых и монополистических подходов к развитию технологий". Интересно, как скоро здесь найдутся свои Юлиус и Этель Розенберги...
@anti_agi
Cursor улетает в космос
Сегодня SpaceX подписал обязывающее соглашение о покупке Anysphere, разработчика редактора Cursor. Сделка целиком в акциях SpaceX, оценка 60 миллиардов долларов, закрытие ожидается в третьем квартале. В апреле это была всего лишь опция: SpaceX мог либо выкупить Cursor за 60 миллиардов, либо заплатить 10 за совместную работу. Теперь опция превратилась в полноценное слияние.
Сюжет тут не про ракеты. xAI так и не сделала свои LLM и харнесс для кодинга: grok-code-fast-1 и Grok Build не стали для разработчиков тем, чем стали Claude Code и Codex, а Маск весь март признавал, что xAI перестраивают с фундамента. Зато у SpaceX есть суперкомпьютер Colossus с сотнями тысяч NVIDIA и не один. У Cursor все наоборот: продукт и аудитория есть, а мощностей на обучение своих моделей не хватало. Поэтому xAI зашел в кодинг не через свою модель, а через чужую: отдал Anysphere мощности и инженеров, а теперь покупает его целиком.
Cursor можно считать самым популярным и самым быстрорастущим ИИ-редактором среди разработчиков: больше 7 миллионов активных пользователей в месяц, выручка перевалила за 2 миллиарда в годовом выражении, развернут в половине компаний из списка Fortune 500. Правда, в корпоративном сегменте по выручке лидирует все равно Anthropic с Claude Code.
И финальный штрих к истории про самостоятельность. Собственная модель Cursor, Composer 2, при запуске в марте подавалась как прорыв: первый собственный претрейн плюс обучение с подкреплением, ни слова о базовой модели. Версия прожила меньше суток. Разработчик под ником fynnso покопался в трафике API и нашел реальный идентификатор: kimi-k2p5-rl, то есть китайская Kimi K2.5 от Moonshot AI плюс RL. Глава претрейна Moonshot подтвердил, что токенизатор полностью совпадает, и публично спросил у основателя Cursor, почему не соблюдается лицензия. Даже Маск ответил в треде коротко: да, это Kimi 2.5.
Дальше Cursor признал, что не упомянуть базу было ошибкой. История не новая: при запуске Composer 1 осенью 2025 сообщество уже находило, что токенизатор подозрительно совпадает с DeepSeek, а модель иногда выдавала китайский текст прямо во время работы. Тогда объяснений не последовало.
Итог простой. Самый громкий пример самостоятельного ИИ-редактора построен поверх китайских open source моделей, а теперь эту конструкцию за 60 миллиардов забирает ракетная компания, у которой свой кодинг не получился. Логика сделок эпохи ИИ выглядит примерно так.
@anti_agi