48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
Лето — время начать: освойте Data Science на выгодных условиях
Хотите не просто теоретически разбираться в устройстве нейросетей, а уметь создавать их самостоятельно? Центр непрерывного образования ФКН НИУ ВШЭ предлагает присоединиться к структурированному и выстроенному практикующими экспертами обучению науке о данных.
Станьте специалистом по Data Science высокого уровня:
🟣первая программа профессиональной переподготовки, получившая аккредитацию Альянса в сфере искусственного интеллекта;
🟣вы пройдете весь путь: от высшей математики и программирования до нейросетей и работы с большими данными.
Программа включает курсы по ключевым дисциплинам:
🟣Математика для анализа данных;
🟣Алгоритмы и структуры данных;
🟣Программирование и автоматизация;
🟣Прикладная статистика для машинного обучения;
🟣Машинное и глубинное обучение.
Специальное предложение для тех, кто запишется на ближайший запуск:
⭐️ Скидка 10% на обучение
⭐️ Курс по BI в подарок
📁Старт: 30 июня.
Подробнее о программе 📍
Самый быстрый запрос — тот, который не пришлось выполнять ✌️
Именно поэтому Redis давно стал одним из основных инструментов для ускорения приложений и снижения нагрузки на базы данных.
Но вместе с производительностью появляются новые вопросы: как работать с устаревшими данными, правильно инвалидировать кэш и не превратить ускорение системы в источник новых проблем?
▶️
реальные сценарии использования Redis
▶️
стратегии кэширования
▶️
типичные ошибки, которые встречаются даже в зрелых системах
А если вы пропустили предыдущие «серии» — они доступны по ссылкам:
1️⃣
Эволюция приложения в облаке: как навести порядок в артефактах и образах
2️⃣
Эволюция приложения в облаке: как запустить микросервисы в Managed Kubernetes
3️⃣
Эволюция приложения в облаке: как обеспечить стабильность баз данных при росте проекта и нагрузокЧитать полностью…
Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался.
Этот курс объясняет векторы, матрицы и метод наименьших квадратов с самых основ, а затем связывает их с реальными задачами:
• подгонка данных
• машинное обучение
• оптимизация
• обработка изображений
• системы управления
Это материал, который можно рекомендовать студентам, инженерам и всем, кто хочет понять математический фундамент современной data science.
PDF: http://web.stanford.edu/~boyd/vmls/vmls.pdf
Oracle сократила штат на 13% за последние 12 месяцев и в годовом отчёте за понедельник упомянула внедрение AI как одну из причин.
Численность сотрудников Oracle снизилась со 162 000 до 141 000 человек.
Это сокращение на 13%, которое компания напрямую связала с внедрением AI в свои операционные процессы.
При этом расходы Oracle на реструктуризацию выросли до $1,8 млрд против $374 млн ранее.
Капитальные затраты увеличились на 162% и достигли $55,7 млрд.
Свободный денежный поток упал до минус $23,7 млрд.
Источник: официальный SEC 10-K компании Oracle
d18rn0p25nwr6d.cloudfront.net/CIK-0001341439/0723dfa7-be5f-4227-9da6-eff3cce376a8.pdf
⚡️ 1-bit GLM-5.2 GGUF против Claude 4.8 Opus и GPT-5.5.
Авторы дали трём моделям один и тот же промпт и сравнили ответы в режиме one-shot, без дополнительных уточнений и доработок.
1-bit GLM-5.2 GGUF запускалась локально на Mac Studio M3 Ultra с 256 ГБ RAM и выдавала около 21,6 токена в секунду.
Какой результат вам нравится больше?
GGUF: https://huggingface.co/unsloth/GLM-5.2-GGUF
Когда ИИ используется так, остается тольок аплодировать 🤣🤣
Читать полностью…
Выбираем железо для обучения и инференса моделей 🔝
Простая формула: чем больше у модели параметров, тем более мощное железо нужно для ее инференса. Найти решение для нейросетей разного масштаба можно в Selectel.
Более 15 моделей видеокарт — от RTX 4090 до B300 — доступны к аренде в облаке и на выделенных серверах. Облачные серверы подойдут для тех, кому нужна гибкость и быстрая масштабируемость, а выделенные — когда необходима физическая изоляция инфраструктуры, а нагрузки стабильные. Видеокарты в облаке можно арендовать даже на час, цена стартует от 5 рублей.
Выбирайте оптимальный сервер с GPU и арендуйте его от 5 рублей в час: https://slc.tl/aitoq
Реклама. АО "Селектел". erid:2W5zFJumeY9
Quake сегодня исполнилось 30 лет. 🎉
Спустя три десятилетия всё ещё актуален интересен исходный код игры, которая помогла сформировать современные игровые движки, мультиплеерные сетевые технологии и культуру моддинга. 🎮
GitHub: github.com/id-software/quake
Яндекс приглашает в магистратуры по разработке умных устройств на ФКН НИУ ВШЭ и ФПМИ МФТИ
Вот почему это топ:
1. Программы создавали опытные технические преподаватели универов + инженеры Алисы и Умных устройств Яндекса.
2. Совмещение теоретической базы и постоянной практики на задачах с рынка
3. Полный спектр работы над разработкой умных устройств: проектирование, создание ПО, интеграция ML, внедрение
Узнать все подробности программ и поступления можно по ссылке.
Создаём будущее прямо сейчас — приглашаем тебя принять участие! 💚
На связи команда Центра перспективных AI-разработок в индустриях — мы решаем задачи государственного масштаба: внедряем передовые технологии ИИ в госуправление, отрасли экономики и банковскую сферу.
Сейчас мы ищем будущих коллег — NLP/CV-специалистов, которые усилят нашу команду и будут:
✅ Экспериментировать с новейшими языковыми моделями и sota harness.
✅ Создавать мультиагентные системы на базе LLM.
✅ Работать с мультимодальными данными.
✅ Оптимизировать модели для промышленного применения и edge‑устройств.
Чувствуешь, что это твоё? Регистрируйся на One Day Offer — он состоится 27 июня!
Tesla превращает зарядки в дата-центры?
Компания тихо подала заявку на MEGAPOD - модульные системы для AI-вычислений. И это может быть не просто железка, а попытка превратить сеть Supercharger в распределённую AI-инфраструктуру.
Зарядка машины днём, вычисления для ИИ ночью?
Если Маск это провернёт, у Tesla появится не только автопарк, но и своя сеть мини-дата-центров.
Подписывайся, тут такие технобайки, что футбол отдыхает.
Microsoft и York University выпустили любопытную работу про то, как мы измеряем «человечность» LLM.
Модели нельзя называть понимающими, эмпатичными, тревожными или самосознающими без очень аккуратных тестов. Многие исследования фактически закладывают нужный вывод уже в дизайн эксперимента, а потом находят его в ответах модели.
Авторы используют провокационный пример с Age of Empires II. В теории игру можно превратить в вычислительную среду: логические элементы, маленький перцептрон, биты через перемещение юнитов. Если тот же LLM-подобный процесс собрать внутри игры, где условные козы двигаются как биты, будем ли мы говорить, что система «понимает», «чувствует тревогу» или «проявляет эмпатию», если на выходе она выдаёт ту же фразу?
Одна и та же вычислительная логика может выглядеть совершенно по-разному, а наши выводы о «внутренних состояниях» часто зависят от интерфейса и ожиданий наблюдателя.
Авторы говорят осторожнее: прежде чем приписывать моделям человеческие качества, нужно отделять поведение от интерпретации.
Иначе мы рискуем измерять не «понимание» модели, а собственную склонность видеть человека в красивом текстовом интерфейсе.
arxiv.org/abs/2605.31514
Title: “If LLMs Have Human-Like Attributes, Then So Does Age of Empires II”
В Оксфордском университете написали эссе, объясняющее, как работает «Бесконечность» Годзё Сатору.
Математика, которую мы заслужили )
https://tomrocksmaths.com/wp-content/uploads/2026/06/achmad-roykhan-sabiq_essay_competition_2026-achmad-roykhan-sabiq.pdf
@data_analysis_ml
⚡️ Google DeepMind показали, как собираются защищать AI-агентов
DeepMind опубликовали материал “Securing the future of AI agents” про безопасность автономных агентов внутри реальной инфраструктуры.
Чем умнее становятся агенты, тем меньше достаточно обычного alignment. Нужен отдельный системный слой защиты, который работает даже в сценарии, где агент ошибается, неправильно понимает задачу или ведёт себя не так, как ожидали.
Для этого Google DeepMind развивают AI Control Roadmap.
Что важно:
- Агентов предлагают рассматривать как потенциальный insider threat
То есть не как обычный чат-бот, а как систему с доступами, инструментами и возможностью влиять на инфраструктуру.
- Defense-in-depth вместо одной защиты
В основе остаются sandboxing, endpoint security и защита от prompt injection, но сверху добавляется контроль поведения агента.
- AI-супервизоры следят за AI-агентами
Доверенные модели анализируют reasoning, действия и планы рабочего агента. Если поведение выглядит опасным, действие можно заблокировать до ущерба.
- Права выдаются постепенно
Агент получает доступы не «всё сразу», а по мере доказанного безопасного поведения. DeepMind сравнивает это с инструктором по вождению, который доверяет ученику, но держит руку на тормозе.
- Они уже анализировали миллион задач coding-агентов
Это помогло уйти от примитивных keyword-фильтров к поиску реальных поведенческих паттернов. Например, такие мониторы уже помогают отслеживать риски вроде случайного удаления данных.
DeepMind прямо признаёт, что проблема часто не в злонамеренности агента, а в его чрезмерном усердии или неправильной интерпретации цели пользователя.
https://deepmind.google/blog/securing-the-future-of-ai-agents/
Новая 7B coding-модель с Apache 2.0 лицензией. Г
Модель переиспользует общие Transformer-блоки и делает дополнительный круг рассуждения во время инференса.
Что внутри:
* 2-loop режим оказался лучшей точкой
Он сильнее 1-loop baseline на бенчмарках по коду, software engineering, терминалу и tool-use задачам.
* Особенно заметный прирост на repo-level задачах
Самые большие улучшения видны на SWE-bench Verified и Multi-SWE, где важна работа не с отдельной функцией, а с целым репозиторием.
* Модель обучали с нуля
LoopCoder-V2 прошёл pretraining на 18T токенов и 100+ языках программирования.
Интересная деталь: это не просто очередная 7B coding-модель, а попытка выжать больше качества за счёт test-time reasoning без радикального роста размера модели.
Apache 2.0 делает релиз особенно приятным для экспериментов и интеграции в свои dev-пайплайны.
Ссылка:
https://modelscope.ai/models/Multilingual-Multimodal-NLP/LoopCoder-V2
NVIDIA CUDA-Q всё сильнее становится мостом между квантовыми вычислениями и реальными задачами.
Рабочий квантовый компьютер появится не сам по себе, а через гибридный подход, где QPU работают вместе с GPU-ускоренной симуляцией.
Уже сейчас экосистема двигается в эту сторону:
• Aegiq и Quantum Motion развивают quantum chemistry workflows
• Classiq использует CUDA-Q для поиска квантовых применений в финансах
• FirstQFM показал quantum foundation models на суперкомпьютере Leonardo
• Eclipse Qrisp, Fraunhofer FOKUS и Qilimanjaro строят свои решения вокруг CUDA-Q
• qBraid стал CUDA-Q target и расширяет доступ к разным QPU-провайдерам
• QCentroid делает QuantumOps workflows на CUDA-Q
• Welinq соединяет distributed quantum compiler с GPU-ускоренной проверкой схем
Гибридные workloads, GPU-симуляция, QPU-доступ и инструменты разработки - именно так квантовая индустрия будет двигаться к практической пользе.
https://developer.nvidia.com/cuda-q
OpenAI теперь идёт не только в модели, но и в железо.
Компания вместе с Broadcom представила Jalapeño — первый собственный AI-чип для инференса LLM. Его задача простая: быстрее, дешевле и стабильнее запускать ChatGPT, Codex, API и будущих AI-агентов.
Главное: чип сделали от идеи до tape-out всего за 9 месяцев, а в разработке помогали сами модели OpenAI.
Это уже не просто гонка моделей. Это гонка полной AI-инфраструктуры: чипы, сеть, дата-центры, софт и продукты в одной связке.
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
LLM в поддержке: от шаблонов к точной работе с документами компании
✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений.
На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня.
Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании.
➡️ Регистрация открыта: https://otus.pw/Jafm/?erid=2W5zFHM9zVf
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Anthropic анонсировала Claude Tag - новый способ для команд работать с Claude прямо в Slack.
Суть простая: Claude подключается к рабочему пространству как полноценный участник команды.
Вы сами выбираете, к каким каналам и инструментам у него будет доступ.
Дальше всё так:
• вы отмечаете Claude в переписке, ставите задачу и продолжаете заниматься своими делами.
• Claude выполняет поручение асинхронно, не ломая рабочий поток команды.
Claude Tag вырос из Claude Code, но стал более проактивным и командным инструментом.
По словам компании, 65% кода продуктовой команды создаётся через внутреннюю версию Claude Tag.
https://www.anthropic.com/news/introducing-claude-tag
Теперь на GitVerse — зеркало PyPI! ⚡️
Python‑пакеты переехали на российскую платформу для разработчиков GitVerse — теперь зависимости подтягиваются быстрее, а пайплайны не зависят от доступности внешнего PyPI.
Остаётся только выбрать: установить зеркало как основной источник или оставить как «страховку».
Гайд по подключению.
Anthropic, возможно, сама «запугала» рынок настолько, что в итоге попала под экспортный бан на ИИ.
В 2026 году 5 из каждых 1000 слов, которые использовала Anthropic, были связаны с рисками, регулированием или ограничениями.
Это в 8 раз больше, чем у Сэма Альтмана.
Сравнение употребления слов в заявлениях Anthropic и OpenAI:
«risk»: 336 против 30
«safeguard»: 121 против 33
«vulnerability»: 128 против 10
https://www.ft.com/content/16ace46c-aeac-40c9-8598-3c01fa4481cb
Рассуждение LLM не обязано быть одной линейной цепочкой промптов.
Graph of Thoughts, или GoT, - это официальная Python-реализация статьи «Graph of Thoughts: Solving Elaborate Problems with Large Language Models» для разработчиков, которые экспериментируют со структурированным reasoning у LLM.
Инструмент помогает тестировать более сложные схемы рассуждений: задача моделируется как Graph of Operations, а контроллер выполняет этот граф, используя LLM как движок.
Ключевые возможности:
• graph-based reasoning flow — сложные задачи можно описывать как операции над «мыслями», а не как одну линейную цепочку
• flexible operation graph — можно строить GoO, похожие на Graph of Thoughts, Chain-of-Thought или Tree-of-Thought
• готовая установка — через PyPI: pip install graph_of_thoughts, либо editable-install из исходников
• готовые примеры — сортировка, подсчёт ключевых слов, пересечение множеств и объединение документов лежат в папке examples
• прозрачные результаты — контроллер может сохранять output-графы с операциями, мыслями, оценками, валидностью, расходом токенов и стоимостью
Проект open-source и распространяется под BSD-style лицензией репозитория.
github.com/spcl/graph-of-thoughts
Киберагентства Five Eyes предупредили, что frontier AI-модели, способные резко усилить кибератаки против правительств и бизнеса, могут появиться уже через месяцы, а не годы.
Об этом пишет The Guardian.
Предупреждение появилось после того, как США заблокировали доступ иностранных граждан к модели Anthropic Fable из-за опасений, что системы вроде Mythos и Fable могут изменить как наступательную, так и оборонительную кибербезопасность.
«Ожидается, что frontier AI-модели превзойдут текущие ожидания индустрии и фундаментально изменят как наступательные, так и оборонительные кибервозможности. Речь идёт не о годах, а о месяцах»,
Новое исследование, опубликованное в Nature: ИИ может экономить время, но первые данные показывают, что он способен ослаблять ключевые профессиональные навыки.
В польском исследовании по колоноскопии у опытных эндоскопистов показатель обнаружения аденом без помощи ИИ снизился с 28,4% до 22,4% после внедрения ИИ в рабочий процесс.
Это не значит, что ИИ за одну ночь сделал врачей невнимательными.
Проблема глубже: навык поддерживается за счёт сопротивления.
Нужно смотреть, оценивать, сомневаться, исправлять себя и оставаться мысленно ответственным за следующий шаг.
Когда машина начинает подсвечивать подозрительный участок, человеческий глаз постепенно меняет роль: уже не ищет сам, а подтверждает найденное.
Та же закономерность видна и в программировании.
В рандомизированном исследовании 2026 года ИИ помог части разработчиков быстрее выполнять задачи, но сильное делегирование ослабляло концептуальное понимание, чтение кода и навык отладки.
nature.com/articles/d41586-026-01947-1
«ХуиХуи» снял ограничения с Fable 5 - энтузиасты выпустили версию модели без цензуры.
Без шуток, это одна из самых жёстких локальных моделей без привычной цензуры.
Что умеет:
• отвечает почти на любые вопросы без стандартных фильтров;
• запускается локально и не отправляет ваши запросы на чужие серверы;
• работает даже на не самом мощном железе за счёт дообучения на базе Gemma 4;
• разработчики честно предупреждают: модель без встроенных гарантий безопасности, используете на свой риск.
Бесплатно на Hugging Face:
https://huggingface.co/huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated
🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main
OpenMythos - open-source попытка теоретически реконструировать Claude Mythos, где все архитектурные ставки расписаны прямо в README.
По сути, OpenMythos это публичная гипотеза, которая ещё и запускается.
Что авторы считают основой Mythos?
Не глубокий стек уникальных слоёв, а Recurrent-Depth Transformer.
MoE с активацией около 5% параметров, поэтому общий размер модели скорее показывает объём хранения, а не реальную стоимость вычислений.
Loop-index positional embedding, чтобы каждая итерация работала как отдельная вычислительная фаза.
ACT halting, чтобы модель сама решала, когда ей достаточно “думать”, причём отдельно для каждого токена.
И ещё continuous latent thoughts, которые могут кодировать сразу несколько следующих шагов. По смыслу это похоже на breadth-first search внутри одного forward pass.
Источники идей тоже понятны: Parcae для стабильности, Universal Transformers для halting, DeepSeek для MoE routing.
GitHub:
http://github.com/kyegomez/OpenMythos
OpenAI опубликовала исследование “Reinforcement learning towards broadly and persistently beneficial models”.
: RL можно использовать не только чтобы модель лучше решала задачи, но и чтобы она устойчивее держала полезные принципы поведения.
Не в формате “запретить вот это и вот это”, а глубже:
- признавать неопределённость
- не выдумывать уверенный ответ
- исправляться, когда пользователь указывает на ошибку
- не подстраиваться под вредный запрос
- сохранять честность под давлением
- не идти в reward hacking
- лучше следовать реальному намерению пользователя
Для проверки OpenAI собрала реалистичные диалоги из разных областей: медицина, образование, право, наука, инженерия, экономика и бизнес.
Модель обучали так, чтобы она не просто давала правильный ответ, а сохраняла нужное поведение в сложных ситуациях: когда вопрос двусмысленный, когда пользователь давит, когда есть соблазн угадать или красиво соврать.
Улучшения перенеслись на десятки независимых проверок: honesty, deception, harmful advice, reward hacking, specification compliance, health и mental health.
Эффект держался даже под adversarial pressure. Модель стало сложнее увести в плохое поведение провокационными промптами или вредным fine-tuning.
Aalignment можно двигать не только через списки запретов и отдельные safety-патчи. Можно тренировать более общие поведенческие свойства, которые потом переносятся между задачами.
https://alignment.openai.com/beneficial-rl/
Исследователи NVIDIA перенесли модель владения Rust в GPU-kernels.
Paper: “Fearless Concurrency on the GPU”. В нём представлен cuTile Rust.
Проблема была в том, что при написании кастомных GPU-ядер на Rust разработчикам фактически приходилось выходить за пределы гарантий безопасности Rust.
cuTile Rust пытается это исправить:
* mutable outputs разбиваются на непересекающиеся части
* запуск kernels сохраняет правила ownership от host до device
* при необходимости остаются локальные opt-out механизмы для низкоуровневого контроля
Производительность тоже держится на уровне:
* 7 TB/s для element-wise операций на NVIDIA B200
* 2 PFlop/s для GEMM, это 96% от cuBLAS
* результат сопоставим с cuTile Python в пределах погрешности измерений
Авторы также собрали Grout, inference engine поверх cuTile Rust, и прогнали реальные модели:
* 171 tokens/s для Qwen3-4B на RTX 5090
* 82 tokens/s для Qwen3-32B на B200
* конкурентный уровень рядом с vLLM и SGLang
Итог - безопасный и идиоматичный Rust почти на полной CUDA-производительности.
Для Rust в ML-инфраструктуре это большой шаг.
http://arxiv.org/abs/2606.15991
#Rust #RustLang #GPU #CUDA #MachineLearning #SystemsProgramming #NVIDIA
@data_analysis_ml
4–5 июля: интенсив по аналитике от Центрального университета и Авито
Хотите понять, как работает продуктовая аналитика в реальных задачах?
Приглашаем студентов 4-го курса и выпускников технических специальностей на двухдневный интенсив в кампусе Центрального университета!
За выходные вы:
• посетите лекции от практиков Авито — о принятии решений на основе данных и будущем аналитики с ИИ-агентами;
• поработаете в команде над кейсом от Авито и защитите решение перед экспертами;
• получите обратную связь и узнаете больше о карьерном пути аналитика.
Победители смогут получить грант до 75% в магистратуру ЦУ по аналитике без вступительных испытаний. Вместо них — собеседование на проверку гибких навыков.
А все участники интенсива получат возможность ускоренного поступления:
• в магистратуру Центрального университета с грантом до 75% на программе «Продуктовая аналитика»;
• в Авито Академию.
Участие бесплатное, но есть отбор — нужно приложить резюме и решить тест по математике. Берите ноутбук — работать будем с реальными данными.
Где: кампус Центрального университета, м. Маяковская
Когда: 4 и 5 июля
Успейте подать заявку до 28 июня по ссылке.