48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
✔️ Прорыв в квантовых вычислениях
Физики Гарварда создали первый в мире квантовый компьютер, который работает непрерывно без перезапуска.
Ранее квантовые машины держались миллисекунды, максимум - около 13 секунд.
Новая установка работает более 2 часов и может функционировать бесконечно.
Ключевое новшество - решение проблемы потери атомов: система в реальном времени пополняет кубиты, впрыскивая 300 000 атомов в секунду с помощью оптических инструментов.
Учёные считают, что практические, постоянно работающие квантовые компьютеры могут появиться уже в течение 2 лет - с огромным влиянием на медицину, финансы и научные исследования.
thecrimson
✔️ Anthropic делает ставку на AI-приложения для бизнеса
По данным The Information, Anthropic продвигает свою модель Claude как основу для создания enterprise-замен привычных приложений вроде Slack. Компания делает ставку на обучение с подкреплением, чтобы улучшить способности модели к программированию.
Похожую стратегию развивает и xAI Илона Маска, но эксперты сомневаются, что крупные корпорации откажутся от укоренившихся систем вроде SAP или ServiceNow. Более вероятно, что первыми такие AI-first инструменты начнут использовать небольшие стартапы.
Тем временем JPMorgan и другие банки активно заявляют об интеграции решений OpenAI, Anthropic и Google, хотя реальные масштабы затрат пока не соответствуют публичному энтузиазму.
theinformation
✔️ Perplexity объявила, что её AI-браузер Comet, ранее доступный только по подписке $200/месяц, теперь стал бесплатным для всех (с ограничениями по запросам).
Comet, запущенный в июле 2025 года, работает как встроенный ассистент: он умеет анализировать страницы, вытаскивать ключевые детали и сердить по ссылкам, проводя многошаговые исследования.
Perplexity также представила Comet Plus за $5 — партнёрскую подписку, которая открывает доступ к контенту от CNN, The Washington Post, Fortune, Los Angeles Times и Condé Nast (The New Yorker, Wired и др.).
Однако запуск совпал с продолжающимися исками от крупных издателей, включая Dow Jones (The Wall Street Journal) и New York Post, обвиняющих стартап в использовании их материалов для обучения ИИ.
Скачать Comet
✔️ OpenAI раскалывает запуск Sora: ИИ-видео как TikTok, но сотрудники бьют тревогу
TechCrunch пишет, что запуск нового соцприложения Sora 2 вызвал тревогу внутри самой OpenAI. Это TikTok-подобная лента, наполненная видео, созданными ИИ, включая дипфейки самого Сэма Альтмана.
Часть исследователей OpenAI считает, что компания уходит от своей миссии ради хайпового контента. Один из сотрудников прямо заявил: «AI-ленты - пугающие. Я был шокирован, узнав, что мы выпускаем Sora 2…»
Сторонники проекта объясняют, что такие продукты нужны, чтобы финансировать фундаментальные исследования и дать пользователям почувствовать силу технологий. В OpenAI утверждают, что хотят «показать людям что-то классное, чтобы они улыбнулись».
Но вместе с ростом Sora OpenAI рискует повторить судьбу классических соцсетей: зависимость, манипуляции c информацией, проблемы с дипфейками и давлением на метрики вовлечённости.
techcrunch
✔️ США продолжают контролировать большинство мировых мощностей для обучения ИИ, строя самые большие и энергоемкие кластеры
Китай в 2025 году вложит до 98 млрд долларов, но экспортные ограничения на топовые чипы Nvidia и AMD тормозят прогресс.
Huawei продвигает Ascend 910C, однако по памяти, пропускной способности и софту он уступает решениям Nvidia. США разрешили ограниченные продажи H20 и MI308 в Китай с 15% налогом, но топовые GPU недоступны китацы, и разрыв в производительности всё ещё в пользу американцев.
X
@ai_machinelearning_big_data
#news #ai #ml
🧠 RamTorch: Эффективное использование памяти для глубокого обучения
RamTorch — это библиотека для PyTorch, оптимизирующая использование памяти при обучении и выводе больших моделей, которые не помещаются в память GPU. Она использует гибридные реализации компонентов нейронных сетей, храня параметры в памяти CPU и передавая их на GPU по мере необходимости.
🚀 Основные моменты:
- Эффективные линейные слои с хранением параметров на CPU
- Асинхронные CUDA потоки для минимизации задержек
- Поддержка оптимизатора ZeRO-1 для распределенного обучения
- Совместимость с существующим кодом PyTorch
📌 GitHub: https://github.com/lodestone-rock/RamTorch
#python
💰 The Information пишет: Мира Мурати привлекла рекордные $2 млрд для своего нового ИИ-стартапа при оценке $10–12 млрд. Это крупнейший посевной раунд в истории США.
Мурати сохранила полный контроль над компанией: её голос в совете директоров весит больше всех остальных вместе взятых, а у основателей акции с 100-кратным правом голоса.
Инвесторы: Andreessen Horowitz, Accel, Nvidia, AMD и Cisco.
Ставка делается на доступ к вычислительным мощностям, выход в корпорации и масштабирование.
В команду стартапа вошёл Джон Шульман (сооснователь OpenAI) и группа экс-исследователей. Фокус команды будет направлен на обучение моделей и совершенствование их архитектуры.
Компания зарегистрирована как public benefit corporation, обещает открытые публикации и первый продукт уже в ближайшие месяцы (дропнутчто-то в open-source).
🎯 Главная идея стартапа: сделать ИИ предсказуемым и детерминированным.
Команда Мурати уверена, что это решаемая проблема. Если убрать случайность, ИИ станет безопасным для медицины, финансов и других критичных областей.
Источник: theinformation.com/articles/10-billion-enigma-mira-murati
🧠 Интеллектуальный исследовательский агент для глубоких исследований
SGR Research Agent использует Schema-Guided Reasoning для автоматического планирования и цитирования. Он поддерживает многоязычность и адаптируется к изменениям в данных, обеспечивая структурированные отчеты с источниками.
🚀 Основные моменты:
- 🤔 Приоритет уточнений при неопределенности
- 🔄 Автоматическая адаптация плана
- 📎 Управление источниками и цитированием
- 🌍 Поддержка русского и английского языков
- 📊 Генерация детализированных отчетов в Markdown
📌 GitHub: https://github.com/vakovalskii/sgr-deep-research
#python
🔥 Refly — это открытая AI-платформа для создания контента с интуитивным интерфейсом на основе свободного полотна!
🌟 Она поддерживает многопоточные диалоги, интеграцию с базами знаний, контекстную память, интеллектуальный поиск и WYSIWYG-редактор. Refly помогает легко превращать идеи в готовый контент, поддерживает облачное и локальное развертывание через Docker.
🔐 Лицензия: Apache-2.0
🖥 Github
@data_analysis_ml
🚀 Мощные мультимодальные модели LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 — это открытая платформа для обучения мультимодальных моделей, демонстрирующая выдающиеся результаты при низких затратах. Модели обучаются на высококачественных данных и обеспечивают превосходную эффективность.
🚀 Основные моменты:
- Полностью открытый исходный код и данные для обучения
- Высокое качество и разнообразие обучающих данных
- Эффективная структура для экономного обучения
- Поддержка современных технологий, таких как MoE и FP8
- Оптимизированный код для масштабируемости
📌 GitHub: https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5
#python
🔥 Zai_org выпускает GLM 4.6!
Новая версия в линейке GLM получила улучшения сразу во всех ключевых направлениях:
- программирование и работа с кодом
- обработка длинных контекстов
- улучшенное рассуждение и поиск
- генерация текста и написание статей
- агентные кейсы и применение в приложениях
RELEASE: http://z.ai/blog/glm-4.6
MODEL 🔜 http://huggingface.co/zai-org/GLM-4.6
Docs: https://docs.z.ai/guides/llm/glm-4.6
МТС приглашает на масштабный ИТ-чемпионат True Tech Champ 2025!
Соревнования пройдут в двух треках: алгоритмы и программирование роботов. Участвовать могут начинающие ИТ-специалисты и опытные разработчики.
В этом году ты сможешь:
— решать алгоритмические задачи в индивидуальном зачете;
— объединиться в команду с другими участниками и управлять роботом в лабиринте с помощью кода;
— попасть на офлайн шоу-финал в качестве участника или зрителя;
— побороться за призовой фонд 10 250 000 рублей.
Отборочные этапы состоятся онлайн, финал — 21 ноября в МТС Live Холл в Москве.
Регистрация открыта до 20 октября. Подай заявку прямо сейчас.
Save the date — 30 октября идем на Яндекс Analytics Talks Meetup
Аналитики Городских сервисов Яндекса расскажут о том, как эффективно использовать данные и искать точки роста продуктов. В программе:
Доклады о том, как создавать продукты и делать их лучше для пользователей. Поговорим про новые фичи, поделимся метриками и сложностями при запусках. Дискуссия про LLM и GenAI в контексте DWH и аналитики — обсудим, приносят ли инструменты реальную пользу или это только хайп.
А еще афтепати с настолками и неформальное общение с экспертами Городских сервисов Яндекса.
📌 30 октября, сбор гостей с 18:00
📌 Москва, офлайн
Регистрируйтесь и зовите друзей!
Мероприятие бесплатное. Количество мест ограничено — пожалуйста, дождитесь нашего подтверждения.
Бизнесу данные нужны как воздух📊
На их основе компании принимают важные стратегические решения. Поэтому спрос на аналитиков растёт в самых разных сферах: от банковской до медицинской.
На курсе «Аналитика данных с МФТИ» готовят специалистов универсальной квалификации. За 10 месяцев вы научитесь использовать Python для анализа данных, применять методы ИИ в своих задачах и работать с базами данных.
С универсальными знаниями вы сможете строить карьеру в одном из трёх направлений аналитики:
➡️Аналитика данных.
➡️Data Science.
➡️Инженерия данных.
🎓 После обучения получите дипломы о профессиональной переподготовке от МФТИ и Нетологии. Центр развития карьеры поможет с трудоустройством, резюме и портфолио.
Записывайтесь на курс и становитесь универсальным специалистом в аналитике → https://netolo.gy/eovL
Реклама. ООО "Нетология". ИНН 7726464125 Erid: 2VSb5wPuu7P
🔊 OpenAI готовится выпускать свое первое «железо» к 2026–2027
Что происходит:
- В OpenAI пришло уже более 24 специалистов из Apple в этом году - в области интерфейсов, камер, аудио, носимых устройств и производства. Команду ведёт Тан Тан, 25 лет проработавший в Apple, теперь - Chief Hardware Officer OpenAI.
- Один из описанных концептов - умная колонка без экрана, плюс исследуются очки, диктофон и носимый пин - как дополнение к смартфону или ноутбуку.
- OpenAI обсуждает модули колонок с Goertek и опирается на китайскую цепочку поставок Apple, что ускорит массовый запуск, но усиливает геополитические риски.
- Фундамент — сделка на $6,5 млрд: покупка io Products у Джони Айва, чья команда теперь интегрирована в OpenAI (при этом LoveFrom продолжает независимую работу).
⚡ Реалии рынка: провал Humane Pin (HP купила и закрыла за $116M) показывает, насколько жестким является сегмент.
🎙️ Если первый продукт будет без экрана и голосоцентричным - успех зависит от:
- дальнобойных микрофонных массивов
- beamforming и низкой задержки wake word
- on-device фильтрации
- плавного облачного хэнд-оффа для быстрых ответов в реальных условиях.
Источник: https://www.theinformation.com/articles/openai-raids-apple-hardware-talent-manufacturing-partners
🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ.
- Выглядит как обычная таблица, но вместо формул — тысячи моделей
- Поддержка OpenAI-совместимых и локальных LLM
- Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки
- Запуск онлайн или локально (Docker / pnpm)
- Полностью опенсорс (Apache-2.0), легко встроить в пайплайны
- Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей
⚡️ Попробовать
#AI #NoCode #datasets #HuggingFace #LLM
🎛️ Claude Squad
Инструмент ориентирован на управление несколькими терминальными агентами искусственного интеллекта (Claude Code, Aider, Codex, OpenCode и Amp).
Проект помогает организовывать взаимодействие разных ИИ и командных инструментов и привлёк более 3,6 тыс. звёзд.
🟠 Ссылка
@data_analysis_ml
⚡️ Tencent представила Hunyuan3D-Part, первую в своём роде open-source модель генерации 3D-объектов на уровне деталей, которая обгоняет все существующие открытые и закрытые решения.
Главное:
🔹 P3-SAM — первая нативная 3D-модель сегментации деталей
🔹 X-Part — генератор деталей с SOTA-результатами по управляемости и качеству
Ключевые особенности:
1️⃣ Обучение на 3.7 млн форм с чистыми аннотациями без использования 2D SAM
2️⃣ Новый автоматический пайплайн сегментации в 3D — полностью без участия пользователя
3️⃣ Диффузионный пайплайн для разбиения на части с учётом геометрии и семантики
Код доступен на GitHub, веса выложены на Hugging Face, а протестировать модель можно как в облегчённой версии на Hugging Face, так и в полном формате через Hunyuan3D Studio.
→Code: https://github.com/Tencent-Hunyuan/Hunyuan3D-Part
→ Веса: https://huggingface.co/tencent/Hunyuan3D-Part
→ Paper: https://arxiv.org/abs/2509.06784
→ Project page: https://murcherful.github.io/P3-SAM/
Попробовать:
→ (Light version) Hugging Face demo: https://huggingface.co/spaces/tencent/Hunyuan3D-Part
→ (Full version) Hunyuan3D Studio: https://3d.hunyuan.tencent.com/studio
🚀 GitHub запустил публичное превью GPT-5-Codex для Copilot
OpenAI представила новую модель GPT-5-Codex, оптимизированную под программирование и агентные задачи.
Она доступна пользователям GitHub Copilot в публичном превью.
Модель можно выбрать прямо в VS Code в режимах Ask, Edit и Agent, но только начиная с версии Copilot v1.104.1. Доступ распространяется на тарифы Pro, Pro+, Business и Enterprise, при этом в бизнес- и корпоративных планах администратор должен включить поддержку GPT-5-Codex в настройках.
https://github.blog/changelog/2025-09-23-openai-gpt-5-codex-is-rolling-out-in-public-preview-for-github-copilot/
⚡ Это прорыв!
Команда UCLA создала оптическую генеративную модель, которая работает на свете, а не на GPU.
В демонстрации шум сначала кодируется в фазовые паттерны с помощью лёгкого энкодера, а затем свободное распространение света (оптический декодер) превращает их в изображения, цифры, одежду, бабочек, лица и даже картины в стиле Ван Гога.
🔥 Главное - во время генерации нет никакой вычислительной нагрузки.
Результаты сопоставимы с цифровыми диффузионными моделями и открывают путь к сверхбыстрому и энергоэффективному ИИ на фотонике.
📄 Paper (Nature): https://nature.com/articles/s41586-025-09446-5#MOESM1
Бизнесу данные нужны как воздух📊
На их основе компании принимают важные стратегические решения. Поэтому спрос на аналитиков растёт в самых разных сферах: от банковской до медицинской.
На курсе «Аналитика данных с МФТИ» готовят специалистов универсальной квалификации. За 10 месяцев вы научитесь использовать Python для анализа данных, применять методы ИИ в своих задачах и работать с базами данных.
С универсальными знаниями вы сможете строить карьеру в одном из трёх направлений аналитики:
➡️Аналитика данных.
➡️Data Science.
➡️Инженерия данных.
🎓 После обучения получите дипломы о профессиональной переподготовке от МФТИ и Нетологии. Центр развития карьеры поможет с трудоустройством, резюме и портфолио.
Записывайтесь на курс и становитесь универсальным специалистом в аналитике → https://netolo.gy/eovL
Реклама. ООО "Нетология". ИНН 7726464125 Erid: 2VSb5wPuu7P
🔥 Новая SOTA среди моделей на 1.5B параметров
QuestA 🤖 показывает двузначный прирост Pass@1 и даже обгоняет ранние 32B-модели:
- AIME24: 72.50% (+10.73%)
- AIME25: 62.29% (+12.79%)
- HMMT25: 41.67% (+10.11%)
🚀 Секрет в обучении: QuestA использует RL с scaffolded-problems — это снимает конфликт между лёгкими и сложными задачами и даёт более масштабируемое рассуждение.
🔓 Всё в открытом доступе:
- Модель: https://huggingface.co/foreverlasting1202/QuestA-Nemotron-1.5B
- Тренировочный пайплайн: https://github.com/foreverlasting1202/QuestA
- Статья: https://arxiv.org/abs/2507.13266
- Блог: https://mercurial-kidney-02d.notion.site/QuestA-Expanding-Reasoning-Capacity-in-LLMs-via-Question-Augmentation-216b21d08abb81a1bcecfe79e7d1e88a?pvs=73
#LLM #Reasoning #AI #SOTA
@data_analysis_ml
📢 ML-трек и аналитика на восьмом международном чемпионате по программированию Yandex Cup
Яндекс открыл регистрацию на международный чемпионат по программированию Yandex Cup с призовым фондом 12 млн рублей и финалом в Стамбуле. Участники смогут соревноваться за призы и выход в финал, а ещё — пройти собеседование в Яндекс по упрощённой схеме.
Главное для участников ML-трека и трека «Аналитика»:
— Квалификация в ML-треке: с 15 октября по 5 ноября
— Трек «Аналитика» начнется с пробного тура 20-29 октября, за которым последует квалификация 2 ноября
— Финал пройдет 5-7 декабря и соберет 180 лучших разработчиков со всех направлений
Регистрация на Аналитику и другие направления открыта до 29 октября, а на ML-трек будет доступна с 15 октября по 5 ноября.
Как выбрать IT-инфраструктуру для ML и как внедрить MLOps?
Реальные бизнес-кейсы
Присоединяйтесь к Selectel Tech Day 8 октября, чтобы узнать о лучших практиках масштабирования ML-проектов и актуальных трендах инфраструктурного ML.
На отдельном ML-треке обсудят:
🔺Как превратить экспериментальные модели в стабильные продакшн-системы.
🔺Как оценить эффективность внедрения ML-решений.
🔺Какая инфраструктура закроет все потребности ML-проектов.
Вас ждет насыщенная программа: содержательные доклады, экспертная дискуссия и воркшоп. Участие бесплатное, нужно только зарегистрироваться →
Реклама. АО "Селектел". erid:2W5zFGWQBHr
Пост для любителей обучать нейросети на работе, после работы, вместо работы, на выходных, в отпуске, с женой или вместо жены.
На прошлой неделе стартовал Wunder RNN Challenge —соревнование по нейронкам от HFT-фонда Wunder Fund.
Участникам предстоит создать модель, предсказывающую следующее состояние рынка на основе последовательности предыдущих состояний. Именно с такими задачами каждый день работают кванты.
Когда
15 сентября — 1 декабря
Призовой фонд
$13,600
Вы будете работать с реальными биржевыми данными.
Победители получат денежные призы, возможность пообщаться с нашими квантами, а главное — утонченное интеллектуальное удовлетворение от решения сложной задачи.
Wunder Fund с 2014 года занимается HFT, высокочастотным алгоритмическим трейдингом. Мы торгуем на многих биржах по всему миру — как традиционных, так и криптовалютных. Наш дневной торговый оборот превышает $10 млрд.
>_ Участвовать
🧲 Caltech сделал рекордный квантовый компьютер — 6 100 кубитов на нейтральных атомах.
💡 В чём прорыв:
Кубиты держатся 12,6 секунд - значит, можно сделать миллионы операций, пока они не «сломаются» от шума.
Управление с точностью 99,98% - критично, потому что коррекция ошибок работает только при редких сбоях.
Лазеры-«пинцеты» разделяют один луч на 12 000 мини-ловушек, которые удерживают атомы в вакууме.
Атомы можно переставлять, не теряя квантовое состояние - это даёт гибкость системе.
🚀 Конкуренты (IBM, Quantinuum) тоже гонят: цель — 100 000 кубитов к 2033 году и полная защита от ошибок к 2029.
decrypt.co/341716/caltech-builds-worlds-largest-neutral-atom-quantum-computer
🚀 Datarus Jupyter Agent: Умный анализ данных
Datarus Jupyter Agent — это мощная система многоступенчатого рассуждения, позволяющая выполнять сложные аналитические задачи с автоматическим восстановлением ошибок и синтезом результатов. Интеграция с Jupyter и Docker обеспечивает надежную среду для анализа данных.
🚀 Основные моменты:
- Многоступенчатое рассуждение с использованием модели Datarus
- Интеграция с Docker для изолированного выполнения
- Поддержка TensorFlow, PyTorch и scikit-learn
- Автоматическое восстановление ошибок
- Управление Jupyter-ноутбуками и экспорт результатов
📌 GitHub: https://github.com/DatarusAI/Datarus-JupyterAgent
@data_analysis_ml
💸 BigTech удваивает ставки на ИИ
- В 2025 компании потратят $345 млрд на AI-инфраструктуру - рост в 2,5 раза за два года.
- Для сравнения: мировой телеком тратит ~$1,5 трлн.
- Проект OpenAI Stargate ($500 млрд к 2029) = ~25% от прогнозируемых $2 трлн при росте в 58% год за годом.
Сэм Альтман видит экспоненту — и она уже в цифрах.
🚀 Вышел Postgres 18 — с поддержкой Async I/O
Раньше все операции чтения были блокирующими, теперь - нет.
Результат: огромный прирост производительности для приложений с интенсивным чтением.
⚡️ Async I/O включён по умолчанию в Postgres 18!
Что интересного:
- Новый алгоритм skip scan для многостолбцовых индексов
- Параллельное построение GIN-индексов (JSON, полнотекст)
- Виртуальные генерируемые столбцы (значения считаются на лету)
- Функция uuidv7() — UUID с временной сортировкой
- Сохранение статистики планировщика при мажорных апгрейдах
- Поддержка OAuth 2.0, улучшения TLS и безопасности
- Новый протокол взаимодействия клиентов и утилит — v3.2
🟠 Релиз: https://www.postgresql.org/about/news/postgresql-18-released-3142/
Alibaba Group представила Memp — новый фреймворк, который даёт LLM-агентам обучаемую и обновляемую процедурную память.
📈 Результат — более высокая успешность и эффективность при сложных задачах.
🧠 Memp превращает прошлый опыт агентов в детальные инструкции и абстрактные стратегии, постоянно совершенствуясь по мере накопления данных.
🔄 Память можно даже передавать более слабым моделям, повышая их возможности.
https://huggingface.co/papers/2508.06433
⚡️ Новые модели для кодинга от Kwaipilot: KAT-Dev-32B и KAT-Coder
- KAT-Dev-32B — 62.4% на SWE-Bench Verified, входит в топ-5 среди open-source моделей
- KAT-Coder — 73.4% на SWE-Bench Verified, результат на уровне лучших проприетарных решений
🔗 Попробовать: https://huggingface.co/Kwaipilot/KAT-Dev
IT_ONE Cup. Code & Analyst — хакатон для аналитиков и разработчиков, где ты узнаешь, как работает IT-команда, и получишь сильный кейс в портфолио. Выбери трек и реши одну из задач:
→ Проанализируй BPMN-модель кредитного процесса и подготовь ТЗ на систему мониторинга эффективности.
→ Разработай сервис, который в реальном времени следит за переводами и оповещает о подозрительных операциях.
🏆 Призовой фонд: 900 000 рублей
💻 Формат: онлайн
🗓 Регистрация до 16 октября: https://cnrlink.com/itonecupmsudataanml
Приглашаем системных аналитиков, разработчиков и менеджеров проектов. Размер команды — от 1 до 5 человек.
Что тебя ждёт:
• Применишь навыки системного анализа, построения архитектуры и работы с потоковыми данными.
• Получишь готовый проект в портфолио.
• Для участников ТОП-5 команд в каждом треке — фирменный мерч.
Задачи соревнования:
Трек 1. Навигатор оптимизации. Проанализируй кредитный процесс банка, выяви узкие места и создай ТЗ для системы мониторинга производительности. Решение поможет оптимизировать критически важные процессы.
Трек 2. Финансовый радар. Разработай сервис для анализа транзакций в реальном времени. Архитектура должна включать правила обнаружения мошенничества и поддержку различных алгоритмов обработки.
Ждём тебя на IT_ONE Cup. Code & Analyst — старт 17 октября на Codenrock: https://cnrlink.com/itonecupmsudataanml
🚀 Новое исследование Hunyuan: Reinforcement Learning on Pre-training Data (RLPT)
Этот метод решает главную проблему масштабирования LLM - ограниченность размеченного текста.
🌟 RLPT даёт моделям возможность учиться рассуждениям напрямую на данных предобучения, без дорогой ручной разметки.
Как это работает:
1️⃣ Модель во время обучения сама исследует данные и учится более общим стратегиям рассуждений.
2️⃣ Никакой дополнительной разметки — награды извлекаются прямо из предобучающих данных.
3️⃣ Награды за предсказание следующего сегмента позволяют масштабировать RL на этапе предобучения.
Результаты:
✅ На Qwen3-4B-Base прирост: +3.0 (MMLU), +5.1 (MMLU-Pro), +8.1 (GPQA-Diamond), +6.0 (KOR-Bench), +6.6 (AIME24), +5.3 (AIME25).
✅ Чем больше вычислений, тем сильнее рост.
✅ Технология создаёт базу для дальнейших улучшений в RLVR.
📄 Подробнее: https://arxiv.org/pdf/2509.19249
#AI #RLPT #LLM #MachineLearning #NLP
@data_analysis_ml
📰 На Yandex Neuro Scale 2025 представили обновлённую AI Studio
Платформа позволяет собирать ИИ-агентов без навыков разработки: от голосовых ассистентов на базе realtime API до мультиагентных систем и инструментов вроде AI Search. При желании на платформе можно запустить и самостоятельно написанного агента.
Встроены готовые решения — Нейроюрист, SpeechSense, инструмент для протоколирования встреч. Для агентов доступны быстрые интеграции по шаблону через MCP Hub – там уже доступны Контур.Фокус и amoCRM, вскоре появятся и сервисы Яндекса.