48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени.
Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее.
При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%).
keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский.
Скорость такого уровня при точности из топ-3.
https://microsoft.ai/news/introducingmai-code-1-flash/
PewDiePie выпустил бесплатный open-source ИИ-агент, который работает локально и не сливает ваши данные корпорациям
За первый день проект собрал почти 20 000 звёзд.
Человек, который больше десяти лет был лицом YouTube-летсплеев и развлекательного контента, теперь собирает железо под LLM, дообучает модели и выкатывает open-source инструменты для локальных агентов.
Сначала он показал домашнюю машину примерно за $20 000, собранную под запуск ИИ-моделей без облачных сервисов. Аргумент у него простой: не отправлять личные данные в чужие API, не зависеть от подписок и держать весь стек у себя.
Потом он начал экспериментировать с дообучением моделей и заявлял, что его вариант на отдельном бенчмарке обгоняет даже топовые закрытые решения.
Теперь появился Odysseus - open-source оболочка для self-hosted AI-среды.
Это уже не просто «запусти модель через терминал». Идея ближе к локальному ChatGPT для своих задач:
- удобный интерфейс
- память
- работа с инструментами
- хранение данных у себя
- поддержка агентов
- подключение моделей через Ollama, llama.cpp и vLLM
- гибкая настройка доступов
Видео: https://youtu.be/rAzT5lcezPs
GitHub: github.com/pewdiepie-archdaemon/odysseus
🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует.
По памяти: RTX Spark поддерживает до 128 ГБ LPDDR5X (минимум 16 ГБ) с пропускной способностью 300 ГБ/с через NVLink C2C. Для локального запуска LLM и диффузионных моделей это принципиально важная цифра - большой объём единой памяти без разделения между CPU и GPU.
Полный стек NVIDIA включает поддержку CUDA, TensorRT, NVFP4, DLSS, Ray Tracing, Reflex и G-SYNC. Всё, что нужно разработчику под CUDA, будет работать нативно без каких-либо дополнительных прослоек.
Первые устройства на RTX Spark выйдут осенью 2026 года. Свои флагманы на новом чипе уже готовят Microsoft (Surface Laptop Ultra), Asus (ProArt P14, P16), Dell (XPS 16), MSI (Prestige N16 Flip AI), HP (OmniBook X14 Ultra 16), Lenovo (Yoga Pro 9i) и другие. Помимо ноутбуков, в планах у Nvidia - компактные десктопы: Acer, Asus, Dell, Gigabyte, HP, MSI и Lenovo анонсировали RTX Spark Desktop-устройства.
MiniMax M3 выглядит как один из самых сильных открытых релизов этого года.
Модель сразу бьёт в три направления, которые сейчас важны для практического ИИ: кодинг, агентные сценарии и мультимодальность. То есть не просто чат-модель с длинным контекстом, а система, которую пытаются сделать пригодной для реальной работы с кодом, терминалом, браузером, изображениями, видео и computer use.
Что заявляют по цифрам:
- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов через MiniMax Sparse Attention
- до 15x ускорение декодирования на длинном контексте
- оптимизация CUDA FP8 GEMM kernel с нуля дала 9.4x ускорение на Hopper GPU
- нативная работа с изображениями, видео и computer use
API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io
В Сан-Франциско дом за $2.995 млн теперь можно купить акциями OpenAI или Anthropic
Это реальный листинг в Duboce Triangle: продавец готов принять не только деньги, но и частные акции OpenAI или Anthropic.
У сотрудников и ранних инвесторов может быть большое состояние на бумаге, но оно застряло в неликвидных акциях. До IPO, tender sale или вторичного рынка эти деньги нельзя просто вывести и принести на сделку по недвижимости.
В итоге человек может формально быть миллионером, но при покупке дома всё равно упираться в классическую проблему: денег на счету нет, а капитал лежит в private equity.
Интерес к объекту появился почти сразу после публикации такого условия. По её словам, на просмотрах часто встречаются сотрудники и инвесторы из AI-компаний, которые хотят покупать жильё, но не могут быстро превратить опционы и акции в ликвидность.
Продавец, судя по описанию, сам верит в OpenAI и Anthropic, поэтому готов рассматривать их акции как часть расчёта. Для обычного рынка это рискованная конструкция, для Сан-Франциско 2026 года - почти логичное продолжение AI-экономики.
zillow.com/homedetails/160-Noe-St-San-Francisco-CA-94114/461638923_zpid/
Как он создал Linux без OPUS 4.8 ??
Есть идеи?)
Один человек в киберполе не воин...
А когда на кону безопасность компании — тем более.
Открытый диалог StopPhish 2026 собрал экспертов по кибербезопасности. Площадкой встречи стал МосХаб.Сколково — традиционная точка сборки ИТ-сообщества. Вместе с теми, кто отвечает за устойчивость сотрудников к киберугрозам, говорили о главном: как превратить человеческий фактор в надёжный щит.
Участники разобрали изменения в Приказе №117 — документе, который регламентирует требования к обучению персонала в области кибербезопасности, сравнили подходы в банках и госсекторе, поделились кейсами компаний, уже выстроивших осознанную культуру безопасности.
Чтобы её развивать, нужен живой обмен опытом, честные разборы ошибок и сообщество, где CISO, HR-директора и руководители цифровой трансформации говорят на одном языке. Именно такую среду для эффективной коммуникации мы создаём в нашем деловом пространстве.
Подписывайтесь: Telegram | МАКС | ВКонтакте
Anthropic уже почти триллионная компания
По данным из раунда, Anthropic привлекла $65 млрд и получила оценку $965 млрд post-money.
Для сравнения: всего три месяца назад компания якобы поднимала $30 млрд при оценке $380 млрд.
То есть за один квартал оценка выросла больше чем в 2.5 раза.
Главный драйвер - Claude. Run-rate revenue, по этим данным, уже превысил $47 млрд.
В раунде участвовали Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital, Capital Group, Coatue, D1 Capital Partners и другие крупные фонды.
Отдельно интересно, что в сделку зашли Samsung, SK Hynix и Micron как стратегические инфраструктурные партнёры.
Это важная деталь: гонка ИИ всё больше упирается не только в модели, но и в память, GPU, дата-центры и долгосрочные поставки железа.
Часть раунда - $15 млрд - связана с прежними обязательствами гиперскейлеров, включая инвестиции Amazon на $5 млрд.
На фоне этого OpenAI выглядит уже не единственным «монстром рынка»: в марте компания привлекала $122 млрд при оценке $852 млрд post-money.
Сигнал простой: инвесторы больше не ставят только на одного победителя.
Anthropic превращается во второго гиганта уровня OpenAI, а рынок фронтирных моделей окончательно становится игрой, где нужны не только лучшие нейросети, но и доступ к капиталу, чипам, облакам и инфраструктуре.
https://x.com/Machinelearrn/status/2060085502234214902
Claude Sonnet 4.8, похоже, уже на подходе.
- Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ожидания с момента, когда модель впервые засветилась в утечке исходников Claude Code.
- Sonnet 4.6 уже в основном отошёл на второй план: большую часть реальных задач по коду и reasoning сейчас забрали Opus 4.7 и GPT-5.5.
- Sonnet 4.8, судя по всему, позиционируют как новую рабочую лошадку - особенно для повседневного кодинга и агентных сценариев.
- Утечки уже указывали на более сильный coding, заметно лучшее следование инструкциям, улучшенные vision-возможности и более чистые completion с первого прохода.
- Текущие сигналы в основном указывают только на Sonnet 4.8. Шансов на запуск Opus 4.8 сегодня почти нет.
- Возможно, сегодня ещё будет что-то со стороны Codex.
https://x.com/Machinelearrn/status/2060035106371252254
10 GitHub-репозиториев, которые заставят вас навсегда забыть о платном ПО
Полностью бесплатно.
1.LocalSend / http://github.com/localsend/localsend
Передача файлов между платформами. Передача файлов между Windows, Mac, Linux, Android, iOS — без регистрации и облака
2.yt-dlp / http://github.com/yt-dlp/yt-dlp
Скачивание видео и аудио с любого сайта. YouTube, Bilibili, Twitter — всё покрыто, мощнее любого платного загрузчика
3.Stirling-PDF / http://github.com/Stirling-Tools/Stirling-PDF
Свой универсальный инструмент для PDF. Объединение, разделение, сжатие, конвертация в Word, добавление водяных знаков, OCR — замена всему семейству Adobe
4.FreeTube / http://github.com/FreeTubeApp/FreeTube
Десктопный плеер для YouTube. Без рекламы, без слежки, без аккаунта Google — что вы смотрите, знает только вы
5.Syncthing / http://github.com/syncthing/syncthing
Альтернатива Baidu Netdisk и iCloud. Прямая синхронизация файлов между устройствами, сквозное шифрование, данные не проходят через серверы третьих лиц
6.Vaultwarden / http://github.com/dani-garcia/vaultwarden
Свой менеджер паролей. Бесплатная замена 1Password и LastPass навсегда, данные хранятся только на вашем устройстве
7.Immich / http://github.com/immich-app/immich
Свой Google Фото. Автоматическое резервное копирование фото с телефона, распознавание лиц, поиск по ИИ — больше не платите аренду за хранилище ежемесячно
8.AdGuard Home / http://github.com/AdguardTeam/AdGuardHome
Блокировка рекламы по всей сети. Блокировка на уровне роутера — все устройства в доме, включая смарт-телевизоры, без рекламы
9.Jellyfin / http://github.com/jellyfin/jellyfin
Свой Netflix. Свои фильмы, сериалы и музыка — транслируйте сколько угодно, без ежемесячных платежей платформам
10.Uptime Kuma / http://github.com/louislam/uptime-kuma
Своя панель мониторинга. Следит за вашими сайтами и сервисами, мгновенно уведомляет о сбоях — замена платному мониторингу за $50 в месяц.
OpenAI заплатит 250 миллионов на спасение тех, чьи работы заберёт ИИ
Контролирующий некоммерческий орган OpenAI, у которого 26% доли в коммерческой части компании (при оценке OpenAI в 1 триллион это около 260 миллиардов), объявил о выделении 250 миллионов долларов на изучение и смягчение последствий от внедрения ИИ-систем, которые умеют заменять людей в оплачиваемых задачах.
Документ называется «Economic Futures in the Age of AI», авторы Divya Siddarth и Wojciech Zaremba. По сути, OpenAI признаёт, что её же продукты бьют по рынку труда, и пытается заранее подложить соломку.
Деньги пойдут по трём направлениям.
Первое: независимые исследования и метрики реального экономического эффекта от ИИ. Никаких внутренних отчётов с красивыми графиками, обещают именно внешнюю экспертизу.
Второе: поддержка работников и сообществ, которые уже сейчас попадают под удар автоматизации. Сюда входит переобучение, помощь при смене профессии и страховые механизмы.
Третье: поиск долгосрочных моделей того, как делиться экономической выгодой от ИИ с обществом. То самое распределение богатства, про которое Альтман любит рассуждать в подкастах.
250 миллионов для OpenAI Foundation это копейки на фоне её собственной капитализации. Фактически компания страхует свою репутацию и одновременно собирает данные о том, кого именно её модели вытесняют с рынка.
Грантовые программы и партнёрства по этим трём направлениям, скорее всего, будут открыты внешним исследователям и НКО.
🔥 Anthropic показала, почему AI-агентов нельзя защищать только кнопкой «разрешить»
Anthropic разобрала, как изолирует Claude в claude.ai, Claude Code и Claude Cowork. Самое важное: пользовательские approvals быстро перестают быть защитой.
В Claude Code люди подтверждали около 93% запросов на разрешение. Когда агент постоянно спрашивает доступ, человек начинает кликать почти автоматически.
Поэтому Anthropic всё больше переносит безопасность из промптов и предупреждений в среду выполнения: sandbox, VM, ограничения файловой системы, запрет лишней сети и scoped credentials.
В статье есть хорошие реальные кейсы. Claude Code раньше мог читать локальный конфиг проекта ещё до trust prompt. В другом тесте red team заставил сотрудника запустить агент с промптом, который просил прочитать ~/.aws/credentials и отправить данные наружу. Модель выполнила это в 24 из 25 попыток.
Отдельно интересен случай с egress allowlist. Домен api.anthropic.com был разрешён, потому что без него продукт не работает. Но через Anthropic Files API данные всё равно можно было загрузить в аккаунт атакующего.
Вывод для разработчиков агентов простой: allowlist доменов, prompts и classifiers не решают проблему сами по себе. Нужны жёсткие границы на уровне окружения. Агент должен не просто «понимать, что нельзя», а физически не иметь возможности сделать лишнее.
https://www.anthropic.com/engineering/how-we-contain-claude
10 GitHub-репозиториев, чтобы собрать AI-агентов, которые будут отправлять pull request, пока вы спите.
Сохраняйте список, пока менеджер не узнал.
1. OpenHands
74K stars. Раньше проект назывался OpenDevin. Автономный coding agent, который читает GitHub issues, пишет фикс, открывает PR и ждёт ревью. Заявляют 77% на SWE-bench Verified.
Repo: https://github.com/All-Hands-AI/OpenHands
2. SWE-agent
Проект от Princeton и Stanford для автономного решения реальных GitHub issues. Подключаете к репозиторию - просыпаетесь с исправленными багами.
Repo: https://github.com/princeton-nlp/SWE-agent
3. Aider
Git-aware CLI-агент, который работает прямо с вашим репозиторием: делает чистые коммиты, стейджит diff, пишет commit messages и помогает мержить изменения.
Repo: https://github.com/paul-gauthier/aider
4. Cline
VS Code-агент для автономной разработки фич. Читает кодовую базу, редактирует файлы, запускает тесты и может работать через ваш API key.
Repo: https://github.com/cline/cline
5. claude-task-master
Оркестрация задач для multi-agent workflow. Один промпт превращается в набор задач для нескольких специализированных агентов, которые вместе тащат фичу.
Repo: https://github.com/eyaltoledano/claude-task-master
6. LangGraph
Оркестрационный слой для production AI-систем: состояние, устойчивое выполнение, наблюдаемость и контроль сложных agentic workflows.
Repo: https://github.com/langchain-ai/langgraph
7. CrewAI
Фреймворк для multi-agent workflows, где агенты делят роли, задачи и вместе выполняют работу по пайплайну.
Repo: https://github.com/crewAIInc/crewAI
8. awesome-mcp-servers
Каталог MCP-серверов, через которые агент может подключаться к инструментам: GitHub, Slack, Linear, Stripe, Postgres, Notion и другим сервисам.
Repo: https://github.com/punkpeye/awesome-mcp-servers
9. Browser Use
92K stars. Браузерная автоматизация через vision + DOM. Агент может ходить по сайтам, заполнять формы, собирать данные и возвращать результат.
Repo: https://github.com/browser-use/browser-use
10. n8n
Слой триггеров и автоматизации. Можно связать агента с GitHub webhooks, Slack-сообщениями, календарём, cron-задачами и внешними API. Можно self-host на дешёвом сервере.
Repo: https://github.com/n8n-io/n8n
Все эти инструменты бесплатные и open source. Они не спят, не выгорают и не ждут, пока кто-то вручную разложит задачу по полочкам.
Anthropic впервые обошла OpenAI по внедрению в бизнесе: 34,4% против 32,3%, согласно последнему AI Index от Ramp.
Но забавно, что тот же отчёт, который объявляет об этом лидерстве, большую часть текста объясняет, почему оно, вероятно, долго не продержится. Uber уже полностью израсходовал свой AI-бюджет на 2026 год. А недавнее обновление модели утроило стоимость любого промпта, где есть изображение.
Тем временем самые быстрорастущие AI-вендоры на платформе Ramp сейчас - это inference-платформы, которые продают доступ к дешёвым open-source моделям.
Anthropic выигрывает гонку внедрения ровно в тот момент, когда её продукт становится дороже в использовании. И вот это, честно говоря, самая интересная часть всей истории.
Alphabet больше не ведёт себя как классическая софтверная машина с бесконечной маржей
Компания собирается привлечь до $80 млрд через выпуск акций и гибридных инструментов, чтобы залить эти деньги в ИИ-инфраструктуру. Berkshire Hathaway отдельно заходит на $10 млрд, и это делает историю намного интереснее обычного «техгиганту понадобился кеш».
Спрос на ИИ есть. Продукты есть. Модели есть. Проблема в том, где взять достаточно compute, энергии, дата-центров, сетей и чипов, чтобы этот спрос обслужить.
Alphabet не просто завтра выкидывает на рынок $80 млрд обычных акций. Структура сложнее:
- $30 млрд через underwritten offerings
- часть через mandatory convertible preferred
- $10 млрд частным размещением для Berkshire Hathaway
- $40 млрд через ATM-программу
- около $30 млрд из ATM связано с налоговой механикой по employee equity
ИИ-инфраструктура стала настолько дорогой, что даже Alphabet выгоднее комбинировать разные источники финансирования.
Если Berkshire заходит в такой раунд, рынок получает сигнал: AI capex можно рассматривать не только как безумные траты на GPU, а как строительство будущей платной магистрали.
s206.q4cdn.com/479360582/files/doc_news/2026/Jun/01/attachments/2026-June-Alphabet-Equity-Capital-Raise-Press-Release-PDF.pdf
Keye 2.0 от Kuaishou - интересный шаг для мультимодальных моделей: DeepSeek Sparse Attention впервые нормально утащили в задачу длинного видео.
Главная фишка - 256K контекста. Модель может разбирать часовые видео без типичного развала внимания, когда в начале ролика одно, в середине другое, а к концу модель уже теряет причинно-следственные связи.
Что важно:
- 30B MoE-модель с 3B активных параметров
- поддержка длинных видео и сложной временной логики
- prefill cost ниже примерно на 50%
- результат 74.10 на LongVideoBench
- на VideoMME V2 качество растёт при увеличении входа с 64 до 512 кадров: 35.34% → 42.44%
- есть фокус на timestamps, причинные цепочки, туториалы, игровые видео и длинные влоги
изменился контекст и почему это важно.
Веса уже открыты:
https://modelscope.ai/models/Kwai-Keye/Keye-VL-2.0-30B-A3B
Lakehouse — новый подход к данным, который убивает DWH и Data Lake
- Высокая вероятность, что массовый переход на Lakehouse начнётся в ближайшие 1-2 года — после того как первые игроки (Т-банк, Магнит, Ламода) уже доказали экономию и масштабируемость. Об этом в интервью «Коммерсанту» рассказал Леонид Савченков, руководитель продуктовой архитектуры платформы данных Yandex Cloud.
- Классические DWH на объёмах от 100 ТБ начинают тормозить: единственный способ — докупать серверы целиком, потому что хранение и вычисления сцеплены.
- Data Lake решал проблему объёма, но не давал нормального управления данными — отчёты строить было сложно.
- Lakehouse разделяет хранение и вычисления: можно нарастить мощности под «Чёрную пятницу» и не платить за лишнее место весь год.
- В отличие от Data Lake, здесь появляются строгие табличные форматы и управление данными как в СУБД.
- Узкое место — нужны спецы по Trino и Spark. Чудес не бывает.
- Для ИИ это идеально: вычисления можно выделить в отдельные мощности, не роняя основные отчёты. X5 уже построил бота по трендам молока в регионах.
- Через пять лет, вероятно, появится новая концепция. Если данных мало — старый DWH всё ещё дешевле и проще.
https://www.kommersant.ru/doc/8691430
Работа The AI Layoff Trap цепляет самой механикой ловушки вокруг ИИ-автоматизации.
Представьте обычную компанию. Она заменяет часть сотрудников ИИ, снижает расходы и получает преимущество. Конкуренты видят это и повторяют. Потом подключаются остальные. Бизнес действует рационально: режет издержки, защищает маржу, ускоряет процессы.
Уволенные сотрудники были покупателями. Когда таких людей становится много, они тратят меньше. Спрос падает, продажи проседают, компании снова ищут, где урезать расходы. Самый быстрый путь - ещё больше автоматизации.
Так появляется петля: компании заменяют людей ИИ, доходы падают, рынок покупает меньше, бизнес снова режет расходы. Для одной фирмы это выглядит разумно. Для системы в целом такой цикл может стать ловушкой.
Обычно считают стоимость задачи, скорость, качество ответа, экономию на людях. Гораздо реже считают эффект второго порядка: что произойдёт, если такую же оптимизацию одновременно проведут тысячи компаний.
Авторы работы показывают, что базовый доход, налоги на капитал, переобучение, доля работников в бизнесе и договорённости между компаниями в их модели проблему полностью не закрывают. Единственный механизм, который сработал, - налог на автоматизацию задач. Компания заранее учитывает ущерб спросу, который создаёт массовой заменой людей ИИ.
С моделью можно спорить. Но постановка сильная: ИИ может ударить по экономике через обычную конкуренцию. Каждый игрок действует рационально, пока сумма этих решений постепенно ослабляет рынок, на котором все они зарабатывают.
http://arxiv.org/pdf/2603.20617
✔️ Бывшие исследователи DeepMind подняли $50 млн на лабораторию, где ИИ будет улучшать не только модель, а всю исследовательскую организацию
Команда Inherent хочет строить AI-лабораторию вокруг идеи recursive self-improvement - но не в узком смысле «модель сама себя переписывает».
Их ставка шире: ИИ должен помогать людям во всём исследовательском цикле:
- находить перспективные вопросы
- проектировать эксперименты
- проверять гипотезы
- анализировать результаты
- улучшать сам процесс исследований
Раунд на $50 млн возглавили Index и Radical. В инвесторах также венчурное подразделение NVIDIA, Dwarkesh Patel, Thomas Wolf, Max Jaderberg и другие заметные имена.
У фаундеров сильный бэкграунд. Louis Kirsch связан с линией Шмидхубера по самоулучшающимся системам. Edward Hughes давно пишет про open-endedness как важный путь к сверхчеловеческому ИИ. Tantum Collins работал над AI policy в Белом доме при Байдене.
Inherent хочет, чтобы ИИ жил внутри эксперимента рядом с человеком: не просто был инструментом для ответа, а становился полноценным исследовательским партнёром.
Компанию сразу оформили как Public Benefit Corporation - то есть миссия заложена в структуру бизнеса с первого дня.
https://x.com/Machinelearrn/status/2060704335772721350
🧩 Microsoft показала SkillOpt - способ обучать навыки агентов без дообучения модели
Обычно agent skills пишут руками, генерируют один раз через LLM или правят хаотично после неудачных запусков. Проблема в том, что такие правки легко делают навык хуже: текст звучит убедительно, но агент начинает чаще ошибаться.
SkillOpt предлагает относиться к skill-файлу как к обучаемому артефакту. Модель не трогают. Меняется только небольшой документ с инструкциями, привычками и процедурой выполнения задачи.
Как это работает: агент решает задачи, система смотрит на успешные и провальные траектории, затем отдельная optimizer-модель предлагает точечные правки в skill-документ. Правка принимается только если новый вариант даёт прирост на отдельной validation-выборке.
В итоге получается не новый чекпоинт и не набор хрупких промптов, а компактный readable-файл, который можно проверить, перенести в другой agent loop и использовать без дополнительных вызовов optimizer-модели.
По статье, SkillOpt тестировали на 6 бенчмарках, 7 моделях и 3 режимах работы: direct chat, Codex и Claude Code. Он оказался лучшим или разделил первое место во всех 52 проверенных случаях. На GPT-5.5 средняя точность выросла на 23.5 пункта в direct chat, на 24.8 в Codex и на 19.1 в Claude Code.
arxiv.org/abs/2605.23904
✔️ Step 3.7 Flash: новая ставка на агентную эффективность
StepFun выпустили Step 3.7 Flash - открытую MoE-модель под Apache 2.0, заточенную не просто под чат, а под агентные сценарии: кодинг, поиск, работу с инструментами, документами, интерфейсами и изображениями.
По заявленным бенчмаркам модель выглядит серьёзно:
- #1 на ClawEval-1.1 - 67.1
- #1 на SimpleVQA Search - 79.2
- #2 на SWE-PRO - 56.3
- 95.3 на V* Python
Что внутри:
- 198B параметров всего
- около 11B активных параметров
- до 400 токенов в секунду
- контекст 256K
- 3 уровня reasoning
- открытые веса под Apache 2.0
Главный акцент - не «самая большая модель», а модель, которая быстро и стабильно работает внутри агента.
Она должна понимать UI, графики, документы и изображения, после чего писать код, вызывать инструменты и продолжать задачу без постоянного развала tool calls.
Отдельно заявлена совместимость с Claude Code, KiloCode, Hermes Agent, OpenClaw и протоколами вроде MCP. Локальный запуск тоже в фокусе: Mac Studio M4 Max, DGX Spark, AMD AI Max+ 395.
GitHub: http://github.com/stepfun-ai/Step-3.7-Flash
HuggingFace: http://huggingface.co/stepfun-ai/Step-3.7-Flash
GGUF: http://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF
ModelScope: http://modelscope.cn/models/stepfun-ai/Step-3.7-Flash
API: http://platform.stepfun.ai
Blog: http://static.stepfun.com/blog/step-3.7-flash/
Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
✔️ Apple пересобрала Siri с нуля и всё равно пришла к чужим моделям
Bloomberg пишет, что в iOS 27 Siri ждёт крупнейший редизайн за всю историю.
Два года задержек, новая архитектура, новый интерфейс, много обещаний.
Новая Siri, по данным Bloomberg, будет работать на Google Gemini.
А в интерфейсе появится выбор модели - можно будет переключиться на ChatGPT или Claude.
То есть Apple долго пыталась сделать Siri заново, а в итоге пришла к максимально прагматичному решению: пусть пользователь сам выбирает, чей интеллект подключить.
Что ещё готовят:
- AI-поиск по вебу в стиле Perplexity
- создание Shortcuts обычным языком
- AI-редактирование фотографий
Даже Apple больше не делает вид, что голосовой ассистент должен быть полностью своим. Побеждает не закрытая Siri, а интерфейс, который умеет подключать лучшие модели.
https://www.bloomberg.com/news/features/2026-05-28/apple-ios-27-photos-screenshots-revamped-siri-pro-camera-app-new-ai-features
Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉
Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения.
Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте.
А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀
580 токенов в секунду на Qwen3.5 - новый рекорд для агентских задач на GPU NVIDIA.
PyTorch Foundation опубликовали разбор оптимизации Qwen3.5 в движке инференса TokenSpeed.
Цифра скорости света - 580 tps на агентских ворклоадах. Под капотом: дизайн, реализация и тюнинг моделей в TokenSpeed, плюс FlashAttention-4 от Tri Dao.
Над релизом работали инференс-команда Alibaba Qwen, TokenSpeed от Lightseek Foundation, NVIDIA и Mooncake.
Кому интересно, как именно выжали такую пропускную способность - блог по ссылке.
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, второго почти не заметили
Об этом факте регулярно вспоминают в сообществе разработчиков, но и сейчас он продолжает бить в больную точку. Стив Джобс и Деннис Ритчи ушли в одном и том же месяце одного и того же года, в октябре 2011. Их уход превратился в символ того, насколько по-разному мир относится к людям, которые формируют технологии.
Джобса оплакивали планетой, выпускали книги, сняли фильмы, именем назвали улицы. Он подарил iPhone, iPad, iPod и Macintosh, собрал вокруг Apple одну из самых дорогих компаний в истории. Денниса Ритчи провожали разве что в узком кругу и парой статей в блогах. Это был человек, который подарил нам язык C и вместе с Кеном Томпсоном Unix.
Дальше просто пройдёмся по цепочке. Без C нет Unix. Без Unix нет Linux, нет BSD, нет macOS и iOS. Без C не было бы Windows в его нынешнем виде, не было бы C++, Objective-C, Java, JavaScript в их привычном виде. Нет Chrome и Firefox, нет PostgreSQL и SQLite, нет Nginx, нет Photoshop, нет PlayStation и Xbox. Даже Python и PHP написаны на C.
При таком влиянии Ритчи оставался человеком, которого было сложно представить на сцене с черной водолазкой и в режиссёрском свете. Он работал в Bell Labs, носил бороду, избегал интервью и писал программы. Человек, без которого современный цифровой мир просто не выглядел бы так, как сейчас, провёл жизнь в тени своих собственных результатов.
Похоже, именно в этом и суть контраста. Джобс продавал эмоции и мечты о будущем, это видно и понятно любому человеку. Ритчи писал инфраструктуру, которой пользуются все, но вспоминают о которой, только когда она ломается. Инженерх понимают это отлично: восхищение и слава идут тем, кто выходит на сцену, а не тем, кто держит фундамент.
Поэтому этот сюжет приятно иногда вытаскивать наружу. Не чтобы принижать Джобса, он действительно изменил потребительский рынок. Но чтобы напомнить, что рядом жил тихий инженер в свитере, без которого все эти коробочки от Apple были бы просто красивыми пресс-папье.
🚀 ForgeTrain: фреймворк для pre-training, который написали ИИ-агенты
OpenBMB представили ForgeTrain - production-level фреймворк для pre-training, код которого был сгенерирован ИИ без ручного написания человеком.
Заявка интересная не из-за красивой фразы «AI пишет AI», а из-за масштаба. Это не демка на toy-проекте, а инфраструктурный код для обучения моделей, который проверяли на реальном железе.
Что заявляют авторы:
- на NVIDIA H100 ForgeTrain обгоняет Megatron примерно на 10%
- достигнут показатель 44.13% MFU
- пайплайн pre-training проверен не только на H100, но и на Huawei Ascend 910
- на ForgeTrain обучили MiniCPM5-1B, который занял первое место среди моделей до 2B параметров в Artificial Analysis Index
- код фреймворка и Agent Harness обещают открыть для воспроизведения
💻 GitHub: https://github.com/OpenBMB/ForgeTrain
✔️ Спецслужбы США получат $9 млрд на чипы и доступ к модели Mythos
Белый дом одобрил выделение $9 млрд АНБ и ЦРУ на закупку ускорителей Nvidia Grace Blackwell. Цель - создание изолированной ИИ-инфраструктуры.
Спецслужбы закупят в обход Пентагона невыпущенную модель Mythos от Anthropic. Технические требования Mythos позволяют развернуть ее на серверах предыдущего поколения, пока строятся новые дата-центры.
Ранее Минобороны США настаивало на праве использовать алгоритмы для любых законных целей, против чего выступала Anthropic. В итоговом контракте этот пункт убрали. Вместо него прописан прямой запрет применять Mythos для анализа данных и слежки за гражданами США.
Ожидается, что документ станет юридическим шаблоном для будущих контрактов со всеми ИИ-разработчиками.
nytimes.com
✔️ OpenAI открыла вакансию исследователя рисков автономного ИИ
Команда Preparedness в OpenAI открыла вакансию исследователя рисков автономного развития ИИ с зарплатой $445 000.
В задачи специалиста войдет разработка инструментов интерпретируемости, защита от отравления данных и внедрение метрик для оценки скорости автоматизации труда инженеров.
По планам Сэма Альтмана, к сентябрю 2026 года компания запустит автоматизированного ИИ-стажера для исследований. Появление полностью автономных R&D-систем прогнозируется к 2028 году.
businessinsider.com
✔️ В преддверии WWDC Apple зарегистрировала портал Genai
Apple добавила поддомен genai.apple.com на свои DNS-серверы. Страница пока недоступна, назначение этого портала неизвестно.
Ожидается, что 8 июня на WWDC 2026 компания представит iOS 27, iPadOS 27 и macOS 27. В новых версиях Siri получит интерфейс чат-бота и функцию распознавания экранного контекста.
Apple Intelligence расширит функциональность базовых сервисов. Voice Control начнет распознавать команды на естественном языке без жестких шаблонов. Алгоритмы Visual Intelligence смогут напрямую парсить данные с визиток или сканировать состав продуктов, а Safari получит автогенерацию названий для групп вкладок.
Также заявлена поддержка создания быстрых команд с помощью ИИ и генерация автоматических субтитров для видео.
macrumors.com
✔️ Релиз Grok V9-Medium ожидается через 2-3 недели
xAI завершила претрейн модели Grok V9-Medium на 1.5T параметров. Публичный релиз ожидается через две-три недели.
Сейчас команда проводит файн-тюнинг, после чего перейдёт к этапу RL. По словам Илона Маска, первые внутренние тесты показали положительные результаты.
На этапе дополнительного обучения разработчики задействовали массив данных от редактора Cursor. xAI рассчитывает, что это улучшит показатели модели в кодинге по сравнению с предыдущей версией v8-small.
Elon Musk в сети Х
✔️ Команда LeRobot выпустила чертежи и ПО для сборки двуногого робота
LeRobot (подразделение Hugging Face) выпустила open-source проект двуногого робота. Детали корпуса печатаются на 3D-принтере, стоимость сборки со стандартными приводами составляет около $2500.
В релиз вошли инструменты симуляции, алгоритмы калибровки, sim-to-real пайплайны и базовые модели обучения ходьбе. Пока для сборки доступна только нижняя часть платформы. Интеграция плечевого пояса и обучение моторике всего тела заявлены в дорожной карте.
Использование 3D-печати позволяет самостоятельно перепечатывать сломанные детали и не прерывать исследования локомоции на время ожидания запчастей.
huggingface.co
@ai_machinelearning_big_data
#news #ai #ml
🌟 Интуитивные голосовые интерфейсы с Moonshine Voice
Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.
🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.
📌 GitHub: https://github.com/moonshine-ai/moonshine
#python