48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
История с будущим IPO OpenAI может получиться очень непростой.
В первом квартале 2026 года у компании, по этим данным, было:
$5,7 млрд выручки
$3,7 млрд сожжённых денег
$9,3 млрд операционного убытка
$665 млрд обязательств на вычислительные мощности до 2030 года
Спрос на ИИ огромный, с этим уже сложно спорить. Но проблема в другом: чтобы оставаться на уровне лучших frontier-моделей, OpenAI приходится тратить колоссальные деньги на инфраструктуру и вычисления.
То есть бизнес растёт, но цена этого роста пока очень высокая.
Cможет ли OpenAI превратить этот спрос в устойчивую прибыльную модель.
И на этом фоне сравнение с Anthropic будет особенно жёстким.
VibeThinker-3B от Weibo
Weibo представила VibeThinker-3B - компактную reasoning-модель на 3B параметров, которая неожиданно сильно выступает в задачах с проверяемым ответом.
На математических бенчмарках вроде AIME 2026 и IMO-AnsBench, а также на новых задачах LeetCode, модель показывает результаты уровня систем, которые в десятки раз больше.
Что интересно:
* сильные результаты в математике и кодинге
* фокус на задачах с чёткой проверкой ответа
* компактный размер 3B
* веса, код и статья открыты
* модель можно запускать на довольно скромном железе
Похоже, рынок всё больше уходит не только в сторону гигантских универсальных моделей, но и в сторону маленьких специализированных reasoning-моделей.
Model : https://huggingface.co/WeiboAI/VibeThinker-3B
Github: https://github.com/WeiboAI/VibeThinker
Paper: https://huggingface.co/papers/2606.16140
#AI #LLM #Reasoning #OpenSource #SmallModel
Яндекс приглашает опытных аналитиков на мероприятия
Мы собрали календарь событий для продуктовых и data-аналитиков, data scientists, маркетинговых и бизнес-аналитиков:
✅ Welcome time — уютные офлайн-встречи. Обсуждаем внутреннюю кухню команд Поисковых сервисов и ИИ, делимся кейсами и неформально общаемся.
✅ Data Driven — главная конференция года про анализ данных для бизнес-решений.
✅ Подкаст и ТГ-канал для тех, кто любит погружаться в детали.
Также периодически проводим мероприятия с быстрым офером.
Заглядывайте на страничку, чтобы узнать больше, и приходите знакомиться с коллегами по цеху и делиться экспертизой.
Перейти на сайт
#реклама
yandex.ru
О рекламодателе
Апдейт по Fable 5 / Anthropic: компания отправила своих ведущих специалистов по безопасности в Вашингтон. Экспортные ограничения всё ещё
Anthropic и администрация Трампа завершили переговоры в понедельник без результата: экспортные ограничения на Claude Fable 5 остаются в силе. Когда их снимут - непонятно.
Компания несколько дней убеждала Вашингтон, что опасения вокруг модели преувеличены. Ту же позицию Anthropic повторила перед исследователями из Министерства торговли США.
Министр торговли Говард Лютник подключился к встрече по телефону с саммита G7 в Эвиане, Франция. Кибердиректор Шон Кэрнкросс в переговорах не участвовал.
Со стороны Anthropic обсуждение вели сооснователь Том Браун и глава внешних связей Сара Хек. Руководитель red teaming Логан Грэм и исследователь безопасности Николас Карлини специально прилетели в Вашингтон для этих переговоров.
Главный спор - можно ли снять защитные ограничения Fable 5 и открыть более мощные возможности Mythos, которые находятся «под капотом». NSA считает, что да. Anthropic утверждает, что риск преувеличен.
Пока нет ясного понимания, какими будут следующие шаги.
@linuxkalii
Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911
@data_analysis_ml
OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколько
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
Быстрый старт в AI-аналитику с DataLens
Обзор AI в DataLens: агентский режим, новые сценарии и on-premises
16 июня в 12:00 мск проведём вебинар о том, как AI-возможности меняют работу с аналитикой в DataLens.
Покажем агентский режим Нейроаналитика, новые сценарии в дашбордах, виджетах, рассылках и встройках, а также разберём, как использовать DataLens в облаке и on-premises.
О чём поговорим:
* большое обновление Нейроаналитика и как устроен агентский режим под капотом
* новые сценарии: виджеты дашборда, рассылки, встройки и публикации
* как подключать внешние AI-инструменты и ускорять работу с DataLens
* доступность AI-возможностей в облаке и on-premises
* планы развития встроенного AI в DataLens и инфраструктуры для внешних AI- инструментов
Вебинар будет полезен аналитикам, BI-специалистам, дата-командам и всем, кто хочет быстрее получать инсайты из данных без лишней ручной работы.
NVIDIA представила Vera CPU как процессор для новой волны AI-фабрик
Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.
Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.
По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.
Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.
NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.
https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/
Отличные новости из нового исследования, опубликованного в Nature. Слово «историческое» тут действительно уместно.
Пациент впервые получил генную терапию, которая должна заставить повреждённые нейроны глаза снова вести себя как молодые клетки.
Важно, что речь не об обычных клетках глаза. Мишень терапии — нейроны центральной нервной системы, похожие на клетки мозга. Обычно после повреждения они почти не восстанавливаются.
Если подход сработает, это станет ранним признаком того, что медицина может научиться чинить нервную ткань, которую раньше считали необратимо повреждённой.
https://www.nature.com/articles/d41586-026-01836-7
Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀
20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.
Ты будешь:
✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.
А ещё ты станешь частью крупнейшего IT‑комьюнити.
Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!
TOXI$, Utopia Show, Тима ищет свет на фесте Яндекса!
Приходи на фест Яндекса 25 июня, получи эксклюзивнный мерч Young Con и узнай, какие технологии реально нужны рынку прямо сейчас. В программе: баттл вузов, воркшопы от действующих разработчиков и выступления от Utopia Show, TRITIA, TOXI$, Ильи Куруча, Александра Пушного, Тимы ищет свет и Сергея Мезенцева.
Зарядись нетворкингом и промокодами от Яндекса.
Место: Москва, ул. Западная, 45, LIVE ARENA
Дата: 25 июня
Вход бесплатный, но нужна регистрация!
Зарегистрироваться
#реклама 16+
yandex.ru
О рекламодателе
Tencent Hunyuan выкатили UniRL - инфраструктуру для RL-посттрейнинга мультимодальных моделей.
Это попытка собрать один общий RL-цикл для разных семейств моделей: LLM, VLM, diffusion, flow matching и unified multimodal.
Обычный пайплайн выглядит знакомо:
- generate
- score
- advantage
- update
- sync
UniRL пытается сделать этот цикл универсальным. Модель и алгоритм разведены как две независимые оси, поэтому можно комбинировать разные model families и RL-алгоритмы без жёстко зашитого сценария.
Покрытие широкое: text-to-image, text/image-to-video, vision-language, text-only LLM, VLM, LLM-to-diffusion prompt enhancer, а также смешанная autoregressive + diffusion генерация вроде Hunyuan-Image 3 и Bagel.
Есть pluggable rollout engines через единый typed contract: train-side, SGLang, vLLM-Omni. Для масштабирования заявлены FSDP2 sharding и несколько deployment-режимов, которые переключаются из одного конфига.
Отдельно Tencent добавили два своих алгоритма:
- Flow-DPPO - policy optimization для flow/diffusion моделей с trust-region masks на основе exact divergence
- DRPO - RL для LLM со сглаженным advantage-weighted quadratic regularizer
UniRL выглядит как шаг к нормальному post-training стеку для моделей, которые одновременно пишут, видят, генерируют и используют разные типы rollout-движков.
Код: http://github.com/Tencent-Hunyuan/UniRL
Статья: arxiv.org/abs/2606.09821
Китайская UBTECH Robotics показала тизеры humanoid-роботов серии U1 для массового рынка.
В линейке две бионические модели:
- старшая версия - 183 см и 42 кг
- младшая версия - 168 см и 35,2 кг
- 88 степеней свободы
- поддержка Wi-Fi
- встроенный ИИ для обучения и взаимодействия с окружением
- автономность до 4 часов
Полная презентация запланирована на 30 июня, но предзаказы уже открыты. По данным компании, зарезервировано 1 943 устройства.
В Юте жители подали в суд из-за гигантского ИИ-дата-центра Stratos, который продвигает Кевин О’Лири.
Проект изначально планировали как кампус на 40 000 акров в Box Elder County. Местные опасаются нагрузки на воду, энергию, экологию и фактически обхода нормального общественного обсуждения. Иск подали пять жителей и Alliance for a Better Utah: они оспаривают роль Military Installation Development Authority, структуры, которая получила слишком широкие полномочия по земле, налогам, безопасности и развитию территории.
На фоне давления О’Лири уже согласился урезать проект почти вдвое и вывести часть земли из застройки, включая участки рядом с Locomotive Springs Waterfowl Management Area. Но даже после сокращения речь всё равно идёт примерно о 20 000 акров - это больше Манхэттена.
История показательная:
- дата-центры продают как вопрос национальной безопасности
- местным обещают рабочие места и налоги
- жители получают риски по воде, земле, шуму, энергии и экологии
- решения часто двигаются быстрее, чем общество успевает понять масштаб
https://www.nbcnews.com/tech/tech-news/utah-residents-sue-officials-kevin-oleary-data-center-plan-rcna348720
Spark Connect для ИТ-команд: упрощаем разработку и работу с данными 😎
Многие компании уже используют Apache Spark для обработки и трансформации данных, но часто только в привычных сценариях.
Spark остаётся инструментом исключительно для Spark‑разработчиков: сложный стек и высокий порог входа мешают вовлекать в работу другие команды. В результате потенциал платформы используется лишь частично.
▶️
Интерактивная разработка со Spark через локальную IDE и Spark Connect;
▶️
Анализ и визуализация данных в Jupyter Notebooks;
▶️
Построение ETL‑процессов в dbt на чистом SQL;
▶️
Сценарии использования Spark для разработчиков, аналитиков и специалистов Data Lakehouse;
▶️
Возможности Evolution Managed Spark для интерактивной работы с данными.
Hugging Face выкатили Serge, опенсорсного ИИ-ревьюера для GitHub.
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
⚡️ DeepSeek завершила первый внешний раунд финансирования и привлекла $7,4 млрд
DeepSeek провела первый раунд внешнего финансирования и привлекла более 50 млрд юаней, примерно $7,4 млрд. Оценка компании, по сообщениям, превысила $50 млрд.
Инвесторы заходят не напрямую в DeepSeek, а через limited partnership, которым управляет CEO компании Лян Вэньфэн. Такая структура позволяет ему сохранить полный контроль над компанией.
Единственное исключение - China National AI Industry Investment Fund. Этот фонд инвестирует напрямую в DeepSeek и получает право голоса. Его вклад составляет 1 млрд юаней.
Обычные инвесторы не получают права голоса, но получают доступ к финансовой информации и приоритетное право участия в будущих раундах. Все доли инвесторов заблокированы на пять лет, чтобы снизить риск краткосрочной спекуляции.
Крупные инвесторы:
* Лян Вэньфэн — 20 млрд юаней
* Tencent — 10 млрд юаней
* CATL — 5 млрд юаней
* JD.com — 3 млрд юаней
* NetEase — 3 млрд юаней
* IDG Capital — 3 млрд юаней
Сообщается, что менеджмент DeepSeek тщательно проверяет личности LP-инвесторов, которые стоят за инвестиционными фондами.
Раньше DeepSeek работала без внешнего финансирования, но растущие расходы на вычисления и усиливающаяся борьба за AI-таланты сделали привлечение капитала необходимым.
Теперь официально: SpaceX покупает Cursor в сделке полностью за акции, оценённой в $60 млрд.
Этот шаг моментально даёт ИИ-империи Илона Маска серьёзный enterprise-продукт для программирования и может помочь xAI сократить отставание от Claude Code от Anthropic и Codex от OpenAI.
Однако на практике всё больше похоже, что xAI скорее сдаёт свои дата-центры в аренду и позиционирует себя как hyperscaler, чем реально стремится участвовать в гонке за SOTA-модель.
🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Китай может решить главную проблему зелёной энергетики уже к 2030 году
Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.
Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.
Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.
И темпы у Китая уже почти неприличные.
Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.
При этом США остаются вторым крупнейшим рынком накопителей после Китая.
Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.
Китай одновременно делает три вещи:
- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.
Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.
https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/
✔️ OpenAI купила стартап Ona
Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.
Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.
Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com
✔️ AI Alliance коллективно обучит открытую модель
Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.
Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.
Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.
До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai
✔️ Сооснователь xAI запустил стартап персонализированных агентов
Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.
Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.
Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com
✔️ Агенты в ChatGPT получили возможность оплачивать покупки через Visa
Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.
OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.
Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com
✔️ Deezer запустил детектор ИИ-музыки
Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.
По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.
Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com
@ai_machinelearning_big_data
#news #ai #ml
Moonshot AI выпустила и открыла Kimi-K2.7-Code - новую модель для кодинга и агентных задач.
По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:
* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite
Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.
Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.
Скоро обещают 6x High-Speed Mode.
Доступна через Kimi API и Kimi Code:
Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai
NVIDIA показала CPO-switch, сделанный вместе с Lambda.
CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.
NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.
Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.
CUDA 13.3 - это не просто очередной апдейт тулкита NVIDIA, а шаг к более высокоуровневому GPU-программированию.
Главное изменение - CUDA Tile теперь доступен в C++. Это модель, где разработчик описывает вычисления через тайлы, а низкоуровневые детали вроде параллелизма, перемещения данных, асинхронности и работы с памятью берёт на себя компилятор. Для C++-команд это важно: можно встраивать tile-подход в существующие CUDA-кодовые базы, не переписывая всё вокруг нового DSL.
Что ещё добавили:
- CUDA Tile C++ для более компактных и переносимых GPU-кернелов
- поддержку Hopper с Compute Capability 9.0
- CompileIQ - автонастройку компилятора под конкретные кернелы
- CUDA Python 1.0 как стабильную версию Python-интерфейса к CUDA
- обновления для checkpointing, IPC и работы с контекстами
- улучшения для tensor interoperability
Самое интересное здесь не «ещё немного быстрее», а смена уровня абстракции. NVIDIA постепенно двигает CUDA от ручного управления потоками, памятью и синхронизацией к модели, где разработчик описывает вычисления, а компилятор сам ищет эффективный путь к железу.
Для AI-инфраструктуры это особенно важно. Кастомные кернелы для attention, GEMM и инференса остаются узким местом, но писать их руками дорого и сложно. CUDA 13.3 делает этот слой доступнее для C++, Python и production-команд, которые хотят выжимать производительность без полного погружения в низкоуровневую CUDA-магию.
NVIDIA явно строит не просто GPU, а полный стек: язык, компилятор, runtime, Python-интерфейсы и инструменты автооптимизации.
https://developer.nvidia.com/blog/nvidia-cuda-13-3-enhances-gpu-development-with-tile-programming-in-c-compiler-autotuning-and-python-updates
Claude 5 Fable - кратко:
- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки
Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.
GPT-5.6 уже близко.
Интересно, выпустит ли OpenAI свой аналог Mythos.
Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.
https://www.anthropic.com/news/claude-fable-5-mythos-5
Что сегодня определяет сильную BI-платформу? Уже не только красивые дашборды.
CNewsMarket опубликовал рейтинг российских BI-систем 2026 года. Аналитики сравнили решения более чем по 130 параметрам: от интеграции с источниками данных и возможностей визуализации до поддержки пользователей, партнерской экосистемы и инструментов self-service аналитики.
Главный вывод исследования — рынок BI продолжает смещаться от отчетности к принятию решений. Компаниям важно не просто собирать данные, а быстро находить инсайты, проверять гипотезы, выявлять аномалии и делать аналитику доступной для бизнес-пользователей без постоянного участия ИТ-команд.
Отдельное внимание в рейтинге уделено ИИ-функциям, работе с разнородными источниками данных и возможностям самостоятельного создания аналитики. По итогам исследования первое место занял DataLens, за ним расположились PIX BI и Luxms BI.
Похоже, что в 2026 году конкуренция между BI-платформами идет уже не столько за количество функций, сколько за скорость получения ответа на бизнес-вопрос.
Google, похоже, даёт Intel Foundry самый важный шанс за последние годы.
По данным The Information, Google выбрала Intel для производства 3 млн+ TPU в 2028 году. Для Intel это не просто крупный заказ, а редкий вход в цепочку поставок одного из главных конкурентов Nvidia в ИИ-железе:
- Intel становится потенциальной второй фабрикой для топовых ИИ-чипов
- Google снижает зависимость от TSMC
- рынок получает ещё одного крупного производителя advanced-node чипов
- Nvidia, Apple, Tesla и другие тоже ищут способы не упереться в один производственный узел
Сейчас TSMC фактически держит горлышко бутылки для ИИ-инфраструктуры. Спрос на ускорители растёт быстрее, чем доступные мощности, поэтому даже гигантам приходится искать запасные маршруты.
Для Google это способ масштабировать TPU и меньше зависеть от Nvidia. Для Intel - проверка, сможет ли её foundry-бизнес наконец стать не презентацией для инвесторов, а реальной альтернативой TSMC.
theinformation.com/articles/google-nvidia-consider-intel-backup-chip-manufacturer
Google Research показали Agentic RAG для Gemini Enterprise Agent Platform - RAG, который не сдаётся после первого поиска.
Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.
У Google идея такая: превратить RAG в многоагентный процесс.
Что внутри:
- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа
Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.
На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.
По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.
Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.
research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/
«Claude-Mythos-5» ненадолго засветился в API. Похоже, скоро релиз.
Интересно, пойдут ли они с ценами из поста про Glasswing: $25 за миллион входных токенов и $125 за миллион выходных.
Если да, это сделает Mythos примерно в 5 раз дороже Opus 4.8.
https://x.com/Machinelearrn/status/2063246572914160053