48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
Новое исследование, опубликованное в Nature: ИИ может экономить время, но первые данные показывают, что он способен ослаблять ключевые профессиональные навыки.
В польском исследовании по колоноскопии у опытных эндоскопистов показатель обнаружения аденом без помощи ИИ снизился с 28,4% до 22,4% после внедрения ИИ в рабочий процесс.
Это не значит, что ИИ за одну ночь сделал врачей невнимательными.
Проблема глубже: навык поддерживается за счёт сопротивления.
Нужно смотреть, оценивать, сомневаться, исправлять себя и оставаться мысленно ответственным за следующий шаг.
Когда машина начинает подсвечивать подозрительный участок, человеческий глаз постепенно меняет роль: уже не ищет сам, а подтверждает найденное.
Та же закономерность видна и в программировании.
В рандомизированном исследовании 2026 года ИИ помог части разработчиков быстрее выполнять задачи, но сильное делегирование ослабляло концептуальное понимание, чтение кода и навык отладки.
nature.com/articles/d41586-026-01947-1
«ХуиХуи» снял ограничения с Fable 5 - энтузиасты выпустили версию модели без цензуры.
Без шуток, это одна из самых жёстких локальных моделей без привычной цензуры.
Что умеет:
• отвечает почти на любые вопросы без стандартных фильтров;
• запускается локально и не отправляет ваши запросы на чужие серверы;
• работает даже на не самом мощном железе за счёт дообучения на базе Gemma 4;
• разработчики честно предупреждают: модель без встроенных гарантий безопасности, используете на свой риск.
Бесплатно на Hugging Face:
https://huggingface.co/huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated
🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main
OpenMythos - open-source попытка теоретически реконструировать Claude Mythos, где все архитектурные ставки расписаны прямо в README.
По сути, OpenMythos это публичная гипотеза, которая ещё и запускается.
Что авторы считают основой Mythos?
Не глубокий стек уникальных слоёв, а Recurrent-Depth Transformer.
MoE с активацией около 5% параметров, поэтому общий размер модели скорее показывает объём хранения, а не реальную стоимость вычислений.
Loop-index positional embedding, чтобы каждая итерация работала как отдельная вычислительная фаза.
ACT halting, чтобы модель сама решала, когда ей достаточно “думать”, причём отдельно для каждого токена.
И ещё continuous latent thoughts, которые могут кодировать сразу несколько следующих шагов. По смыслу это похоже на breadth-first search внутри одного forward pass.
Источники идей тоже понятны: Parcae для стабильности, Universal Transformers для halting, DeepSeek для MoE routing.
GitHub:
http://github.com/kyegomez/OpenMythos
OpenAI опубликовала исследование “Reinforcement learning towards broadly and persistently beneficial models”.
: RL можно использовать не только чтобы модель лучше решала задачи, но и чтобы она устойчивее держала полезные принципы поведения.
Не в формате “запретить вот это и вот это”, а глубже:
- признавать неопределённость
- не выдумывать уверенный ответ
- исправляться, когда пользователь указывает на ошибку
- не подстраиваться под вредный запрос
- сохранять честность под давлением
- не идти в reward hacking
- лучше следовать реальному намерению пользователя
Для проверки OpenAI собрала реалистичные диалоги из разных областей: медицина, образование, право, наука, инженерия, экономика и бизнес.
Модель обучали так, чтобы она не просто давала правильный ответ, а сохраняла нужное поведение в сложных ситуациях: когда вопрос двусмысленный, когда пользователь давит, когда есть соблазн угадать или красиво соврать.
Улучшения перенеслись на десятки независимых проверок: honesty, deception, harmful advice, reward hacking, specification compliance, health и mental health.
Эффект держался даже под adversarial pressure. Модель стало сложнее увести в плохое поведение провокационными промптами или вредным fine-tuning.
Aalignment можно двигать не только через списки запретов и отдельные safety-патчи. Можно тренировать более общие поведенческие свойства, которые потом переносятся между задачами.
https://alignment.openai.com/beneficial-rl/
Исследователи NVIDIA перенесли модель владения Rust в GPU-kernels.
Paper: “Fearless Concurrency on the GPU”. В нём представлен cuTile Rust.
Проблема была в том, что при написании кастомных GPU-ядер на Rust разработчикам фактически приходилось выходить за пределы гарантий безопасности Rust.
cuTile Rust пытается это исправить:
* mutable outputs разбиваются на непересекающиеся части
* запуск kernels сохраняет правила ownership от host до device
* при необходимости остаются локальные opt-out механизмы для низкоуровневого контроля
Производительность тоже держится на уровне:
* 7 TB/s для element-wise операций на NVIDIA B200
* 2 PFlop/s для GEMM, это 96% от cuBLAS
* результат сопоставим с cuTile Python в пределах погрешности измерений
Авторы также собрали Grout, inference engine поверх cuTile Rust, и прогнали реальные модели:
* 171 tokens/s для Qwen3-4B на RTX 5090
* 82 tokens/s для Qwen3-32B на B200
* конкурентный уровень рядом с vLLM и SGLang
Итог - безопасный и идиоматичный Rust почти на полной CUDA-производительности.
Для Rust в ML-инфраструктуре это большой шаг.
http://arxiv.org/abs/2606.15991
#Rust #RustLang #GPU #CUDA #MachineLearning #SystemsProgramming #NVIDIA
@data_analysis_ml
4–5 июля: интенсив по аналитике от Центрального университета и Авито
Хотите понять, как работает продуктовая аналитика в реальных задачах?
Приглашаем студентов 4-го курса и выпускников технических специальностей на двухдневный интенсив в кампусе Центрального университета!
За выходные вы:
• посетите лекции от практиков Авито — о принятии решений на основе данных и будущем аналитики с ИИ-агентами;
• поработаете в команде над кейсом от Авито и защитите решение перед экспертами;
• получите обратную связь и узнаете больше о карьерном пути аналитика.
Победители смогут получить грант до 75% в магистратуру ЦУ по аналитике без вступительных испытаний. Вместо них — собеседование на проверку гибких навыков.
А все участники интенсива получат возможность ускоренного поступления:
• в магистратуру Центрального университета с грантом до 75% на программе «Продуктовая аналитика»;
• в Авито Академию.
Участие бесплатное, но есть отбор — нужно приложить резюме и решить тест по математике. Берите ноутбук — работать будем с реальными данными.
Где: кампус Центрального университета, м. Маяковская
Когда: 4 и 5 июля
Успейте подать заявку до 28 июня по ссылке.
Spark Connect для ИТ-команд: упрощаем разработку и работу с данными 😎
Многие компании уже используют Apache Spark для обработки и трансформации данных, но часто только в привычных сценариях.
Spark остаётся инструментом исключительно для Spark‑разработчиков: сложный стек и высокий порог входа мешают вовлекать в работу другие команды. В результате потенциал платформы используется лишь частично.
▶️
Интерактивная разработка со Spark через локальную IDE и Spark Connect;
▶️
Анализ и визуализация данных в Jupyter Notebooks;
▶️
Построение ETL‑процессов в dbt на чистом SQL;
▶️
Сценарии использования Spark для разработчиков, аналитиков и специалистов Data Lakehouse;
▶️
Возможности Evolution Managed Spark для интерактивной работы с данными.
Hugging Face выкатили Serge, опенсорсного ИИ-ревьюера для GitHub.
Работает просто: вызываете агента в комментариях к pull request, и он сам проходит по diff, ищет баги, спорные места и оставляет замечания прямо в PR.
Что удобно:
* можно задавать правила ревью прямо в репозитории
* можно указать, на что агент должен обращать внимание
* можно заранее описать, что стоит игнорировать
* ревью запускается через обычный комментарий
* проект open source
Разработчики Hugging Face уже используют Serge внутри компании, в том числе для ревью в diffusers и transformers.
По сути, это ещё один шаг к новой норме: ревью кода становится не только задачей людей, но и постоянным AI-слоем поверх GitHub.
Не замена нормальному code review, а дополнительный фильтр, который может поймать очевидные баги, регрессии и странные решения до того, как до них дойдёт человек.
https://huggingface.co/blog/huggingface/serge
⚡️ DeepSeek завершила первый внешний раунд финансирования и привлекла $7,4 млрд
DeepSeek провела первый раунд внешнего финансирования и привлекла более 50 млрд юаней, примерно $7,4 млрд. Оценка компании, по сообщениям, превысила $50 млрд.
Инвесторы заходят не напрямую в DeepSeek, а через limited partnership, которым управляет CEO компании Лян Вэньфэн. Такая структура позволяет ему сохранить полный контроль над компанией.
Единственное исключение - China National AI Industry Investment Fund. Этот фонд инвестирует напрямую в DeepSeek и получает право голоса. Его вклад составляет 1 млрд юаней.
Обычные инвесторы не получают права голоса, но получают доступ к финансовой информации и приоритетное право участия в будущих раундах. Все доли инвесторов заблокированы на пять лет, чтобы снизить риск краткосрочной спекуляции.
Крупные инвесторы:
* Лян Вэньфэн — 20 млрд юаней
* Tencent — 10 млрд юаней
* CATL — 5 млрд юаней
* JD.com — 3 млрд юаней
* NetEase — 3 млрд юаней
* IDG Capital — 3 млрд юаней
Сообщается, что менеджмент DeepSeek тщательно проверяет личности LP-инвесторов, которые стоят за инвестиционными фондами.
Раньше DeepSeek работала без внешнего финансирования, но растущие расходы на вычисления и усиливающаяся борьба за AI-таланты сделали привлечение капитала необходимым.
Теперь официально: SpaceX покупает Cursor в сделке полностью за акции, оценённой в $60 млрд.
Этот шаг моментально даёт ИИ-империи Илона Маска серьёзный enterprise-продукт для программирования и может помочь xAI сократить отставание от Claude Code от Anthropic и Codex от OpenAI.
Однако на практике всё больше похоже, что xAI скорее сдаёт свои дата-центры в аренду и позиционирует себя как hyperscaler, чем реально стремится участвовать в гонке за SOTA-модель.
🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B
Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
Китай может решить главную проблему зелёной энергетики уже к 2030 году
Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.
Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.
Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.
И темпы у Китая уже почти неприличные.
Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.
При этом США остаются вторым крупнейшим рынком накопителей после Китая.
Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.
Китай одновременно делает три вещи:
- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.
Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.
https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/
✔️ OpenAI купила стартап Ona
Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.
Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.
Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com
✔️ AI Alliance коллективно обучит открытую модель
Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.
Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.
Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.
До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai
✔️ Сооснователь xAI запустил стартап персонализированных агентов
Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.
Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.
Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com
✔️ Агенты в ChatGPT получили возможность оплачивать покупки через Visa
Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.
OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.
Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com
✔️ Deezer запустил детектор ИИ-музыки
Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.
По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.
Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com
@ai_machinelearning_big_data
#news #ai #ml
Moonshot AI выпустила и открыла Kimi-K2.7-Code - новую модель для кодинга и агентных задач.
По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:
* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite
Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.
Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.
Скоро обещают 6x High-Speed Mode.
Доступна через Kimi API и Kimi Code:
Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai
Создаём будущее прямо сейчас — приглашаем тебя принять участие! 💚
На связи команда Центра перспективных AI-разработок в индустриях — мы решаем задачи государственного масштаба: внедряем передовые технологии ИИ в госуправление, отрасли экономики и банковскую сферу.
Сейчас мы ищем будущих коллег — NLP/CV-специалистов, которые усилят нашу команду и будут:
✅ Экспериментировать с новейшими языковыми моделями и sota harness.
✅ Создавать мультиагентные системы на базе LLM.
✅ Работать с мультимодальными данными.
✅ Оптимизировать модели для промышленного применения и edge‑устройств.
Чувствуешь, что это твоё? Регистрируйся на One Day Offer — он состоится 27 июня!
Tesla превращает зарядки в дата-центры?
Компания тихо подала заявку на MEGAPOD - модульные системы для AI-вычислений. И это может быть не просто железка, а попытка превратить сеть Supercharger в распределённую AI-инфраструктуру.
Зарядка машины днём, вычисления для ИИ ночью?
Если Маск это провернёт, у Tesla появится не только автопарк, но и своя сеть мини-дата-центров.
Подписывайся, тут такие технобайки, что футбол отдыхает.
Microsoft и York University выпустили любопытную работу про то, как мы измеряем «человечность» LLM.
Модели нельзя называть понимающими, эмпатичными, тревожными или самосознающими без очень аккуратных тестов. Многие исследования фактически закладывают нужный вывод уже в дизайн эксперимента, а потом находят его в ответах модели.
Авторы используют провокационный пример с Age of Empires II. В теории игру можно превратить в вычислительную среду: логические элементы, маленький перцептрон, биты через перемещение юнитов. Если тот же LLM-подобный процесс собрать внутри игры, где условные козы двигаются как биты, будем ли мы говорить, что система «понимает», «чувствует тревогу» или «проявляет эмпатию», если на выходе она выдаёт ту же фразу?
Одна и та же вычислительная логика может выглядеть совершенно по-разному, а наши выводы о «внутренних состояниях» часто зависят от интерфейса и ожиданий наблюдателя.
Авторы говорят осторожнее: прежде чем приписывать моделям человеческие качества, нужно отделять поведение от интерпретации.
Иначе мы рискуем измерять не «понимание» модели, а собственную склонность видеть человека в красивом текстовом интерфейсе.
arxiv.org/abs/2605.31514
Title: “If LLMs Have Human-Like Attributes, Then So Does Age of Empires II”
В Оксфордском университете написали эссе, объясняющее, как работает «Бесконечность» Годзё Сатору.
Математика, которую мы заслужили )
https://tomrocksmaths.com/wp-content/uploads/2026/06/achmad-roykhan-sabiq_essay_competition_2026-achmad-roykhan-sabiq.pdf
@data_analysis_ml
⚡️ Google DeepMind показали, как собираются защищать AI-агентов
DeepMind опубликовали материал “Securing the future of AI agents” про безопасность автономных агентов внутри реальной инфраструктуры.
Чем умнее становятся агенты, тем меньше достаточно обычного alignment. Нужен отдельный системный слой защиты, который работает даже в сценарии, где агент ошибается, неправильно понимает задачу или ведёт себя не так, как ожидали.
Для этого Google DeepMind развивают AI Control Roadmap.
Что важно:
- Агентов предлагают рассматривать как потенциальный insider threat
То есть не как обычный чат-бот, а как систему с доступами, инструментами и возможностью влиять на инфраструктуру.
- Defense-in-depth вместо одной защиты
В основе остаются sandboxing, endpoint security и защита от prompt injection, но сверху добавляется контроль поведения агента.
- AI-супервизоры следят за AI-агентами
Доверенные модели анализируют reasoning, действия и планы рабочего агента. Если поведение выглядит опасным, действие можно заблокировать до ущерба.
- Права выдаются постепенно
Агент получает доступы не «всё сразу», а по мере доказанного безопасного поведения. DeepMind сравнивает это с инструктором по вождению, который доверяет ученику, но держит руку на тормозе.
- Они уже анализировали миллион задач coding-агентов
Это помогло уйти от примитивных keyword-фильтров к поиску реальных поведенческих паттернов. Например, такие мониторы уже помогают отслеживать риски вроде случайного удаления данных.
DeepMind прямо признаёт, что проблема часто не в злонамеренности агента, а в его чрезмерном усердии или неправильной интерпретации цели пользователя.
https://deepmind.google/blog/securing-the-future-of-ai-agents/
Новая 7B coding-модель с Apache 2.0 лицензией. Г
Модель переиспользует общие Transformer-блоки и делает дополнительный круг рассуждения во время инференса.
Что внутри:
* 2-loop режим оказался лучшей точкой
Он сильнее 1-loop baseline на бенчмарках по коду, software engineering, терминалу и tool-use задачам.
* Особенно заметный прирост на repo-level задачах
Самые большие улучшения видны на SWE-bench Verified и Multi-SWE, где важна работа не с отдельной функцией, а с целым репозиторием.
* Модель обучали с нуля
LoopCoder-V2 прошёл pretraining на 18T токенов и 100+ языках программирования.
Интересная деталь: это не просто очередная 7B coding-модель, а попытка выжать больше качества за счёт test-time reasoning без радикального роста размера модели.
Apache 2.0 делает релиз особенно приятным для экспериментов и интеграции в свои dev-пайплайны.
Ссылка:
https://modelscope.ai/models/Multilingual-Multimodal-NLP/LoopCoder-V2
История с будущим IPO OpenAI может получиться очень непростой.
В первом квартале 2026 года у компании, по этим данным, было:
$5,7 млрд выручки
$3,7 млрд сожжённых денег
$9,3 млрд операционного убытка
$665 млрд обязательств на вычислительные мощности до 2030 года
Спрос на ИИ огромный, с этим уже сложно спорить. Но проблема в другом: чтобы оставаться на уровне лучших frontier-моделей, OpenAI приходится тратить колоссальные деньги на инфраструктуру и вычисления.
То есть бизнес растёт, но цена этого роста пока очень высокая.
Cможет ли OpenAI превратить этот спрос в устойчивую прибыльную модель.
И на этом фоне сравнение с Anthropic будет особенно жёстким.
VibeThinker-3B от Weibo
Weibo представила VibeThinker-3B - компактную reasoning-модель на 3B параметров, которая неожиданно сильно выступает в задачах с проверяемым ответом.
На математических бенчмарках вроде AIME 2026 и IMO-AnsBench, а также на новых задачах LeetCode, модель показывает результаты уровня систем, которые в десятки раз больше.
Что интересно:
* сильные результаты в математике и кодинге
* фокус на задачах с чёткой проверкой ответа
* компактный размер 3B
* веса, код и статья открыты
* модель можно запускать на довольно скромном железе
Похоже, рынок всё больше уходит не только в сторону гигантских универсальных моделей, но и в сторону маленьких специализированных reasoning-моделей.
Model : https://huggingface.co/WeiboAI/VibeThinker-3B
Github: https://github.com/WeiboAI/VibeThinker
Paper: https://huggingface.co/papers/2606.16140
#AI #LLM #Reasoning #OpenSource #SmallModel
Яндекс приглашает опытных аналитиков на мероприятия
Мы собрали календарь событий для продуктовых и data-аналитиков, data scientists, маркетинговых и бизнес-аналитиков:
✅ Welcome time — уютные офлайн-встречи. Обсуждаем внутреннюю кухню команд Поисковых сервисов и ИИ, делимся кейсами и неформально общаемся.
✅ Data Driven — главная конференция года про анализ данных для бизнес-решений.
✅ Подкаст и ТГ-канал для тех, кто любит погружаться в детали.
Также периодически проводим мероприятия с быстрым офером.
Заглядывайте на страничку, чтобы узнать больше, и приходите знакомиться с коллегами по цеху и делиться экспертизой.
Перейти на сайт
#реклама
yandex.ru
О рекламодателе
Апдейт по Fable 5 / Anthropic: компания отправила своих ведущих специалистов по безопасности в Вашингтон. Экспортные ограничения всё ещё
Anthropic и администрация Трампа завершили переговоры в понедельник без результата: экспортные ограничения на Claude Fable 5 остаются в силе. Когда их снимут - непонятно.
Компания несколько дней убеждала Вашингтон, что опасения вокруг модели преувеличены. Ту же позицию Anthropic повторила перед исследователями из Министерства торговли США.
Министр торговли Говард Лютник подключился к встрече по телефону с саммита G7 в Эвиане, Франция. Кибердиректор Шон Кэрнкросс в переговорах не участвовал.
Со стороны Anthropic обсуждение вели сооснователь Том Браун и глава внешних связей Сара Хек. Руководитель red teaming Логан Грэм и исследователь безопасности Николас Карлини специально прилетели в Вашингтон для этих переговоров.
Главный спор - можно ли снять защитные ограничения Fable 5 и открыть более мощные возможности Mythos, которые находятся «под капотом». NSA считает, что да. Anthropic утверждает, что риск преувеличен.
Пока нет ясного понимания, какими будут следующие шаги.
@linuxkalii
Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911
@data_analysis_ml
OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколько
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
Быстрый старт в AI-аналитику с DataLens
Обзор AI в DataLens: агентский режим, новые сценарии и on-premises
16 июня в 12:00 мск проведём вебинар о том, как AI-возможности меняют работу с аналитикой в DataLens.
Покажем агентский режим Нейроаналитика, новые сценарии в дашбордах, виджетах, рассылках и встройках, а также разберём, как использовать DataLens в облаке и on-premises.
О чём поговорим:
* большое обновление Нейроаналитика и как устроен агентский режим под капотом
* новые сценарии: виджеты дашборда, рассылки, встройки и публикации
* как подключать внешние AI-инструменты и ускорять работу с DataLens
* доступность AI-возможностей в облаке и on-premises
* планы развития встроенного AI в DataLens и инфраструктуры для внешних AI- инструментов
Вебинар будет полезен аналитикам, BI-специалистам, дата-командам и всем, кто хочет быстрее получать инсайты из данных без лишней ручной работы.
NVIDIA представила Vera CPU как процессор для новой волны AI-фабрик
Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.
Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.
По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.
Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.
NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.
https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/