48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
⚡️ Fable 5 снова вернулась в Claude
Модель снова доступна спустя почти три недели после отключения. Ограничения с Anthropic сняли: ранее их вводили из-за формулировки про «угрозу нацбезопасности».
До 7 июля Fable 5 можно использовать в подписках Pro, Team, Max и Premium Enterprise. На неё разрешено тратить до 50% недельных лимитов.
После 7 июля бесплатный доступ закончится, останется только оплата по токенам.
https://claude.ai/
🔥 Tencent Hunyuan представила PhoneBuddy - агентный фреймворк для управления телефоном на базе Qwen3.5-4B.
Средняя производительность выше, чем у GPT-5.4 и Seed 2.0 Pro, но ниже, чем у Gemini 3.1 Pro.
На бенчмарке из 150 задач результаты выросли так:
SFT: 36.67%
Real-app RL: 40.67%
Hybrid RL: 45.33%
На AndroidWorld рост ещё заметнее:
60.3% → 83.2%
https://arxiv.org/abs/2606.23049
⚡️ Google открыла Nano Banana 2 Lite и Gemini Omni Flash
Google выкатила два новых инструмента для генеративных медиа: Nano Banana 2 Lite для быстрых изображений и Gemini Omni Flash для видео и conversational editing.
Nano Banana 2 Lite - самая быстрая и дешёвая image-модель в линейке Nano Banana. Она рассчитана на high-throughput пайплайны, прототипирование и массовую генерацию, где важны скорость и цена. Google заявляет около 4 секунд на text-to-image и цену $0.034 за 1K image. При этом модель сохраняет нормальное следование промпту, стабильность персонажей и читаемый текст внутри изображения.
Gemini Omni Flash - модель для генерации и редактирования видео через текст, изображения и видео-референсы. Её можно использовать для natural language video editing, мультимодальных сцен, синхронизации текста с действием и быстрых итераций. Цена заявлена на уровне $0.10 за секунду видео, как у Veo 3.1 Fast.
Сначала Nano Banana 2 Lite быстро генерирует изображение, потом Omni Flash превращает его в видео. Через Interactions API можно сохранять историю сессии и делать до трёх последовательных правок.
Ограничения у Omni Flash пока есть: генерация до 10 секунд, audio references и scene extension в API ещё не поддерживаются, а длинные video references пока обрабатываются неидеально.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
@data_analysis_ml
Команда LongCat представила LongCat-2.0 - полную модель, которая стоит за Owl Alpha на OpenRouter.
Это MoE-модель на 1.6T параметров, примерно с 48B активных параметров и контекстом до 1M токенов. Основной фокус - agentic coding и длинные задачи, где модели нужно не просто отвечать, а работать с репозиторием, терминалом, поиском и большим объёмом контекста.
В архитектуре есть несколько важных решений. LongCat Sparse Attention отвечает за эффективную работу с 1M-context. Zero-Compute Experts динамически активируют от 33B до 56B параметров на токен, не тратя вычисления на лишние эксперты. MOPD делит экспертизу на три группы: Agent, Reasoning и Interaction, а gate выбирает нужный маршрут под задачу.
По заявленным результатам модель выглядит сильной именно в агентных сценариях: 70.8 на Terminal-Bench 2.1, 59.5 на SWE-bench Pro, 77.3 на SWE-bench Multilingual, 73.2 на FORTE, 78.8 на RWSearch и 79.9 на BrowseComp.
Tech Blog: https://longcat.chat/blog/longcat-2.0/
🖥 NVIDIA показала HORIZON для agentic hardware design
У NVIDIA вышла работа про HORIZON - систему, где агентное программирование переносится в дизайн железа.
Идея интересная: hardware design рассматривается не как разовая генерация Verilog-кода, а как эволюция целого репозитория. Markdown harness превращается в project pack: внутри доменные знания, исполняемый evaluator, критерий приёмки и правила работы с git.
Дальше агент не просто пишет кусок кода, а меняет изолированное worktree, запускает проверки и двигается по результатам verifier harness.
Для железа это особенно важно. Здесь мало красивого ответа в чате: дизайн должен проходить исполняемые тесты, симуляции и формальные ограничения. Поэтому verifier становится настоящим интерфейсом между агентом и задачей.
В статье заявляют 100% benchmark completion на нескольких наборах задач по hardware design. Даже если вы не работаете с EDA, за этим стоит следить: agentic coding начинает заходить туда, где ошибка стоит намного дороже, чем сломанный unit test.
Paper: https://arxiv.org/abs/2606.28279
✔️ Fine-tuning больших LLM больше не обязан быть мучительно медленным.
4 open-source библиотеки, которые ускоряют обучение моделей:
1. Unsloth AI
Ускоряет fine-tuning Qwen, Llama, Gemma и других моделей, снижает расход VRAM, подходит даже для consumer GPU и Colab/Kaggle.
https://github.com/unslothai/unsloth
2. LLaMA Factory
Удобный CLI и WebUI для fine-tuning 100+ моделей. Поддерживает LoRA, QLoRA, full/frozen tuning и разные режимы квантования.
https://github.com/hiyouga/LLaMA-Factory
3. DeepSpeed
Фреймворк для масштабного distributed training: ZeRO, FSDP, multi-GPU, multi-node и продвинутая оптимизация памяти.
https://github.com/deepspeedai/DeepSpeed
4. Axolotl
Yaml-based пайплайн для LoRA/QLoRA, DPO, GRPO и multimodal fine-tuning. Хорошо дружит с Hugging Face.
https://github.com/axolotl-ai-cloud/axolotl
США снова открыли доступ к Claude Mythos 5 от Anthropic для более чем 100 одобренных организаций.
Теперь доступ к Mythos 5 получат более 100 компаний и институтов, включая многие компании из Fortune 500.
«Я определил, что необходимые меры безопасности соблюдены, чтобы разрешить отдельным доверенным партнёрам доступ к модели Claude Mythos 5», - написал министр торговли Говард Латник в пятницу Тому Брауну, chief compute officer Anthropic.
Точный список Annex A не был опубликован.
Ранее публичная founding group Project Glasswing включала AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks.
Но этот публичный список партнёров не является тем же самым, что секретный список Annex A.
Похоже, правительство делает приоритет на институтах, где defensive upside выше, а риск misuse проще контролировать: cloud providers, chip-компании, vendors операционных систем, security-компании, банки, операторы инфраструктуры и федеральные агентства.
https://www.semafor.com/article/06/27/2026/us-releases-powerful-anthropic-model-mythos-to-some-us-companies
OpenAI показала GPT-5.6 Sol.
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
• max — больше времени на глубокое рассуждение
• ultra — работа через субагентов для сложных процессов
Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
🚨 Правительство США будет решать, кто получит доступ к GPT-5.6.
OpenAI выпустит GPT-5.6 только в формате ограниченного preview для небольшой группы партнёров.
Сэм Альтман сказал сотрудникам, что правительство будет «одобрять доступ отдельно для каждого клиента».
Министр торговли Говард Латник лично звонил Альтману с предупреждением: не запускать модель без согласований с другими ведомствами.
Это уже де-факто режим лицензирования.
https://www.theinformation.com/articles/trump-administration-asks-openai-stagger-release-new-model-security-concerns
Google добавили computer use в Gemini 3.5 Flash.
Теперь модель может вызывать функции, а работать с интерфейсом как пользователь: видеть экран, понимать задачу, нажимать, проверять и продолжать действие.
Раньше computer use был отдельной моделью, теперь это часть основной Gemini Flash.
Отдельно добавили защиту: подтверждение чувствительных действий и остановку задач при подозрении на prompt injection.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/
Qwen показали Qwen-AgentWorld - модель, которая учится симулировать среду, в которой агент действует.
Обычно LLM тренируют лучше пользоваться инструментами: искать, писать код, кликать по вебу, работать с терминалом.
А здесь идея другая: научить модель моделировать сами окружения.
Qwen-AgentWorld симулирует 7 типов агентных сред:
• MCP
• Search
• Terminal
• SWE
• Web
• OS
• Android
То есть модель пытается предсказывать, что произойдёт после действия агента в среде. Не пост-фактум адаптация, а цель обучения с первого дня.
Если языковая модель умеет моделировать окружение, её можно использовать как тренировочную площадку для агентов.
Авторы идут по двум направлениям:
1. построить foundation model для симуляции сред
2. проверить, усиливает ли world modeling обучение агентов
Самое интересное: по их данным, agentic RL в контролируемой симуляции может быть эффективнее, чем обучение в реальных средах. А предварительное обучение на предсказание окружений усиливает агентов даже без отдельного agent-specific fine-tuning.
Грубо говоря, это шаг к «тренажёру реальности» для AI-агентов.
Paper: https://arxiv.org/abs/2606.24597
Blog: https://qwen.ai/blog?id=qwen-agentworld
GitHub: https://github.com/QwenLM/Qwen-AgentWorld
HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld
ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
Anthropic утверждает: Alibaba продолжает в больших масштабах дистиллировать Claude для обучения Qwen. Источник - Bloomberg.
Anthropic обвиняет операторов, связанных с Alibaba, в масштабной кампании по незаконному доступу к Claude через почти 25 000 фейковых аккаунтов.
По данным Bloomberg, Anthropic заявляет, что в рамках этой кампании с апреля по июнь было сгенерировано 28,8 млн обменов с Claude. Целью были способности вроде software engineering и agentic reasoning.
Компания считает это частью более широкой схемы «adversarial distillation», когда китайские лаборатории якобы собирают ответы американских frontier-моделей, чтобы обучать конкурирующие системы за гораздо меньшие деньги.
Посмотрим, насколько хорошим будет Qwen 3.8. Возможно, он окажется FABLEous хорош.
https://www.bloomberg.com/news/articles/2026-06-24/anthropic-accuses-alibaba-of-illicitly-accessing-its-ai-models
Лето — время начать: освойте Data Science на выгодных условиях
Хотите не просто теоретически разбираться в устройстве нейросетей, а уметь создавать их самостоятельно? Центр непрерывного образования ФКН НИУ ВШЭ предлагает присоединиться к структурированному и выстроенному практикующими экспертами обучению науке о данных.
Станьте специалистом по Data Science высокого уровня:
🟣первая программа профессиональной переподготовки, получившая аккредитацию Альянса в сфере искусственного интеллекта;
🟣вы пройдете весь путь: от высшей математики и программирования до нейросетей и работы с большими данными.
Программа включает курсы по ключевым дисциплинам:
🟣Математика для анализа данных;
🟣Алгоритмы и структуры данных;
🟣Программирование и автоматизация;
🟣Прикладная статистика для машинного обучения;
🟣Машинное и глубинное обучение.
Специальное предложение для тех, кто запишется на ближайший запуск:
⭐️ Скидка 10% на обучение
⭐️ Курс по BI в подарок
📁Старт: 30 июня.
Подробнее о программе 📍
Самый быстрый запрос — тот, который не пришлось выполнять ✌️
Именно поэтому Redis давно стал одним из основных инструментов для ускорения приложений и снижения нагрузки на базы данных.
Но вместе с производительностью появляются новые вопросы: как работать с устаревшими данными, правильно инвалидировать кэш и не превратить ускорение системы в источник новых проблем?
▶️
реальные сценарии использования Redis
▶️
стратегии кэширования
▶️
типичные ошибки, которые встречаются даже в зрелых системах
А если вы пропустили предыдущие «серии» — они доступны по ссылкам:
1️⃣
Эволюция приложения в облаке: как навести порядок в артефактах и образах
2️⃣
Эволюция приложения в облаке: как запустить микросервисы в Managed Kubernetes
3️⃣
Эволюция приложения в облаке: как обеспечить стабильность баз данных при росте проекта и нагрузокЧитать полностью…
Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался.
Этот курс объясняет векторы, матрицы и метод наименьших квадратов с самых основ, а затем связывает их с реальными задачами:
• подгонка данных
• машинное обучение
• оптимизация
• обработка изображений
• системы управления
Это материал, который можно рекомендовать студентам, инженерам и всем, кто хочет понять математический фундамент современной data science.
PDF: http://web.stanford.edu/~boyd/vmls/vmls.pdf
В продуктах VK появится нейропоиск Discovery AI — новый движок для поиска и рекомендаций на базе собственной LLM.
Технологию внедрят в Дзен, VK Видео и Медиапроекты Mail.
В отличие от привычных ИИ-помощников, этот движок не ищет по всему интернету, а копается только в контентной базе продуктов VK и учитывает интересы пользователя. Система может выдавать ответы быстрее чем за полсекунды и обрабатывать до 3 000 поисковых запросов в секунду.
https://habr.com/ru/companies/vk/articles/1054358/
⚡Выбирать железо для обучения и инференса моделей больше не нужно
Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.
Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.
Что вы получаете в пару кликов:
⚡Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
⚡Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
⚡Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/i0hn1
Реклама. АО "Селектел". erid:2W5zFGqCmpM
Fable 5 может потребовать верификацию личности
* Новые строки из утечки приложения Claude намекают, что Fable 5 могут вынести в отдельную систему usage credits, с оплатой вне обычной подписки.
* В том же обновлении упоминается проверка личности: «Ваши кредиты будут добавлены после подтверждения вашей личности». Это появилось рядом с изменениями по кредитам для Fable 5, хотя Anthropic раньше говорила, что ID-проверки не связаны с Fable.
* Похоже, Fable 5 может выйти с верификацией личности, более строгим доступом и отдельной оплатой по использованию.
❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️
Как научить ИИ искать информацию, управлять контекстом и автоматизировать сложные процессы?
Ответы на эти вопросы разберут на событии Yandex AI Studio Series Summer Edition, которое стартует 16 июля и продлится до 30 июля.
Событие объединит экспертов Яндекса и специалистов, которые создают современные ИИ-продукты и хотят глубже разобраться в архитектуре агентных систем и возможностях Yandex AI Studio.
Для кого:
— backend- и fullstack-разработчиков;
— ML/ИИ-инженеров;
— продуктовых менеджеров;
— бизнес-аналитиков, интеграторов и ИИ-стартапов.
Присоединяйтесь к Yandex AI Studio Series, чтобы узнать, как применять ИИ-инструменты в реальных задачах, а не только экспериментировать с ними.
FT: Apple просит Вашингтон разрешить закупку DRAM у CXMT, китайского поставщика из чёрного списка, потому что спрос на AI-серверы сделал обычную память для устройств болезненно дорогой.
DRAM - это краткосрочная рабочая память внутри iPhone, Mac и iPad. HBM - более быстрая многослойная версия памяти для AI-ускорителей. Из-за AI-бума производственные мощности всё сильнее уходят в серверы, а не в потребительские устройства.
Проблема Apple в давлении поставщиков. Компания в основном зависит от Micron, Samsung и SK Hynix, тогда как CXMT могла бы дать более дешёвую поставку из китайской программы развития памяти, поддержанной государством.
Но CXMT находится в списке Chinese Military Company у Пентагона. Сам по себе он не запрещает Apple покупать у компании, но сигнализирует о риске для нацбезопасности. Ситуация станет куда серьёзнее, если Минторг США добавит CXMT в Entity List.
Потеря Apple $263 млрд рыночной стоимости была связана с давлением цен на память, из-за которого пришлось поднимать цены на MacBook и iPad. Это показывает, как спрос на AI-инфраструктуру уже повышает себестоимость обычных потребительских устройств.
https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1
BrowserBC - новый open-source проект от команды ViDA, который исследует более эффективный способ запускать web agents.
Вместо того чтобы использовать frontier-модель на каждом шаге agent workflow, BrowserBC один раз записывает человеческий web flow с помощью более сильной модели, превращает его в переиспользуемый skill, а затем отдаёт выполнение меньшей и более дешёвой модели.
Результаты выглядят заметно: на WebArena-Hard число tool calls падает на 27%, а success rate растёт с 60% до 81%.
https://github.com/Einsia/Browser-BC
Anthropic начала возвращать доступ к Claude Mythos 5, но пока не всем.
Компания заявила, что с 12 июня работала с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5.
Теперь власти разрешили снова развернуть Mythos 5 для части американских организаций, которые занимаются эксплуатацией и защитой критической инфраструктуры.
Anthropic называет Mythos 5 своей самой сильной моделью для кибербезопасности.
То есть доступ возвращают не глобально, а сначала тем структурам, которые работают с инфраструктурой, безопасностью и защитой систем.
Параллельно компания продолжает переговоры с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступной для общего использования.
Ситуация хорошо показывает новый режим для frontier-моделей: релиз уже зависит не только от самой лаборатории, но и от согласований с государством.
https://x.com/AnthropicAI/status/2070665903440871779
Это очень сильный отчёт - The State of the AI Economy от Exponential View.
Главная идея: AI-экономика уже стала реальным рынком, а не только хайпом вокруг инфраструктуры.
Ключевые цифры:
• $110 млрд реальной AI-выручки за последние 12 месяцев после удаления двойного счёта. То есть если $1 потратили на Claude, он считается один раз, даже если часть денег потом ушла Amazon или другому инфраструктурному провайдеру.
• $175 млрд - текущий annualized run rate. Это показывает резкое ускорение рынка. Считаются расходы конечных клиентов, а не деньги, которые просто проходят по цепочке поставщиков.
В расчёт не включали Китай, внутреннюю экономию компаний от AI, рост рекламы, консалтинг и системную интеграцию.
Темпы роста примерно в 3 раза быстрее, чем у мобильного интернета и обычного интернета на ранних этапах.
Скорость формирования выручки резко выросла: новый $1 млрд AI-выручки теперь появляется меньше чем за 2 дня. В 2023 году на это уходило около 180 дней.
Enterprise AI уже вышел за рамки пилотов, но глубокое внедрение на уровне всей компании всё ещё только начинается.
Упоминания AI появились в отчётных звонках у 31% отслеживаемых компаний из S&P 500.
Но только 20% компаний дали конкретные численные оценки влияния AI на бизнес.
Интересный момент по инфраструктуре: AI-выручка hyperscalers пока примерно покрывает амортизацию AI-инфраструктуры.
Но экономика GPU сильно зависит от предположения, что вычислительное оборудование будет использоваться около 6 лет. Для другой AI-инфраструктуры срок моделируют примерно на 14 лет.
Снижение цен на токены не обязательно снижает выручку.
Каждое снижение цены токенов на 10% приводит к росту использования токенов примерно на 12-18%.
Это значит, что спрос на AI выглядит эластичным по цене: чем дешевле становится AI, тем быстрее растёт использование.
Главные ограничения для будущего масштабирования - доступность электроэнергии и стоимость дата-центров.
intelligence.exponentialview.co
🌺 Релиз Ornith-1.0 - новое семейство open-source LLM, специализированных под agentic coding.
Ornith-1.0 выходит в разных размерах:
• 9B Dense
• 31B Dense
• 35B MoE
• 397B MoE
Модели показывают state-of-the-art результаты среди open-source моделей сопоставимого размера на coding-бенчмарках:
• Terminal-Bench 2.1 — 77.5
• SWE-Bench — 82.4 на verified, 62.2 на pro, 78.9 на Multilingual
• NL2Repo — 48.2
• SWE Atlas — 41.2 на QnA, 42.6 RF, 39.1 TW
• ClawEval — 77.1
Ornith-1.0 дообучали поверх Gemma 4 и Qwen 3.5.
Reinforcement learning используется не только для генерации решений, но и для создания task-specific scaffolds, которые направляют эти решения.
То есть модель совместно улучшает и «каркас» задачи, и итоговое решение. За счёт этого она генерирует более качественные ответы в agentic coding.
Все модели выпущены под MIT-лицензией, поэтому их можно использовать и в коммерческих, и в исследовательских проектах.
📖Tech Blog: http://deep-reinforce.com/ornith_1_0.html
🤗Huggingface: http://huggingface.co/collections/deepreinforce-ai/ornith-10
🖥 IBM показала технологию чипов ниже 1 нанометра.
Речь о 0,7 нм, или 7 ангстремах. Это уже масштаб, где индустрия упирается почти в атомные размеры.
В чипе представлена новая 3D-архитектура nanostack.
Вместо того чтобы просто уменьшать транзисторы, IBM предлагает укладывать их слоями и плотнее размещать внутри чипа.
Что обещают:
• почти 100 млрд транзисторов на чипе размером с ноготь
• до 50% больше производительности
• или до 70% выше энергоэффективность по сравнению с 2 нм
• более плотную SRAM для AI-нагрузок.
IBM говорит о пути к производству примерно в ближайшие 5 лет.
https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
Почему разрыв между академическим ML и реальными задачами до сих пор существует — и как его сокращают Авито, МФТИ и ВШЭ
Авито открыл набор на три магистратуры с МФТИ и ВШЭ — программы, построенные на реальных задачах компании.
Суть простая: бизнес зашёл в университет не деньгами, а экспертизой. В разработке участвовало 300+ сотрудников, преподают действующие специалисты.
Дальше всё так:
• Студент с первого дня работает с кейсами живых продуктов, а не с учебными датасетами.
• Выпускник выходит с опытом, который обычно нарабатывают первые полгода на позиции.
Три направления: «Прикладное машинное обучение и анализ данных» с МФТИ, «Машинное обучение в цифровом продукте» с ФКН ВШЭ и «Управление продуктом в IT-бизнесе» с ВШБ ВШЭ — для продактов, с прицелом на уровень middle.
Поступить можно из любого региона России.
Подробнее по ссылкам:
МФТИ
ВШЭ (ML)
ВШЭ (продакт)
📌 WSJ: коммерческие сделки OpenAI связаны с ростом личных инвестиций Сэма Альтмана
The Wall Street Journal со ссылкой на судебные документы, ставшие публичными в ходе процесса "Маск против OpenAI", опубликовала расследование о том, что контракты OpenAI повышали оценку стартапов, в которые лично вкладывается Сэм Альтман.
Для контекста: Альтман не владеет долей в самой OpenAI, поэтому его доходы зависят от внешних инвестиций.
Всего, по данным WSJ, не менее 10 компаний из инвестиционного портфеля Альтмана имеют сделки с OpenAI.
Сам Альтман и представители компаний называют сотрудничество обычной практикой.
NVIDIA CUDA-Q всё сильнее становится мостом между квантовыми вычислениями и реальными задачами.
Рабочий квантовый компьютер появится не сам по себе, а через гибридный подход, где QPU работают вместе с GPU-ускоренной симуляцией.
Уже сейчас экосистема двигается в эту сторону:
• Aegiq и Quantum Motion развивают quantum chemistry workflows
• Classiq использует CUDA-Q для поиска квантовых применений в финансах
• FirstQFM показал quantum foundation models на суперкомпьютере Leonardo
• Eclipse Qrisp, Fraunhofer FOKUS и Qilimanjaro строят свои решения вокруг CUDA-Q
• qBraid стал CUDA-Q target и расширяет доступ к разным QPU-провайдерам
• QCentroid делает QuantumOps workflows на CUDA-Q
• Welinq соединяет distributed quantum compiler с GPU-ускоренной проверкой схем
Гибридные workloads, GPU-симуляция, QPU-доступ и инструменты разработки - именно так квантовая индустрия будет двигаться к практической пользе.
https://developer.nvidia.com/cuda-q
OpenAI теперь идёт не только в модели, но и в железо.
Компания вместе с Broadcom представила Jalapeño — первый собственный AI-чип для инференса LLM. Его задача простая: быстрее, дешевле и стабильнее запускать ChatGPT, Codex, API и будущих AI-агентов.
Главное: чип сделали от идеи до tape-out всего за 9 месяцев, а в разработке помогали сами модели OpenAI.
Это уже не просто гонка моделей. Это гонка полной AI-инфраструктуры: чипы, сеть, дата-центры, софт и продукты в одной связке.
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
LLM в поддержке: от шаблонов к точной работе с документами компании
✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений.
На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня.
Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании.
➡️ Регистрация открыта: https://otus.pw/Jafm/?erid=2W5zFHM9zVf
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.